Test: PCI-e 1x, 2x, 4x, 8x og 16x analyse.

HT Exclusive d.  01. marts. 2009, skrevet af NoNig 21 Kommentarer.  Vist: 14085 gange.

Korrekturlæser: 
Billed behandling: 
Oversættelse: 

Pristjek på http://www.pricerunner.dk 
Produkt udlånt af: Highpoint
DK distributør: Highpoint

Analyse

 

Lad os springe lige ud i det. Herunder har vi resultaterne præsenteret i en læsevenlig facon. Vi kan starte med at kigge på de reelle afmålinger (FPS).

 

 

  

Der er to ting her der springer lige i face. Først og fremmest, så ser CoD4 (Call of Duty 4) faktisk ud til at skalere ret ok ift. antallet af PCI-e lanes. En ting jeg specielt synes er ret interessant er, hvad der sker omkring PCI-e 2.0 2x (hvad der svarer til PCI-e 4x på det gamle interface og AGP 8x). Vi rammer en frame-rate på rundt regnet 49 FPS over hele linjen. Dvs. at det er hér jeg ville starte og mene, at vi har opnået en acceptabel frame-rate. Går vi opad, forøger vi med rundt regnet 12 FPS, 8 FPS og sidst omkring 3-4 FPS - Aner man en sammenhæng delelig med 4?


*Nominel ydelse imellem de forsk. hastigheder med PCI-e 2.0 1x som "base"-score*

Ser vi i stedet på den procentvise forøgelse, så kan vi se, at vi "maxer" ud ved PCI-e 2.0 16x. Vi halverer ydelsesforskellen, for hver gang vi fordobler antallet af lanes. Med andre ord. Der var noget som kunne tyde på, at Call of Duty 4 - Modern Warfare, kan styre båndbredden på PCI-e interfacet ret godt. Det er meget stik imod mine forventninger. Omvendt, så er den nominelle forbedring på omtrendt 5 % eller hvad jeg har målt til omtrendt 3-4 FPS. Så "nødvendigheden" af PCI-e 2.0 16x (over PCI-e 16x) kan med rette bestrides. Men der er en forskel.

 

   

 

Her har du så den direkte årsag til, hvorfor jeg har valgt netop disse to titler. Jeg sidder pt. og har gang i en anden artikel, og lagde mærke til noget spøjst ved Counter-Strike:Source. Som jeg skrev i det foregående afsnit, så har jeg testet med alt på max. Der var noget som kunne tyde på, at Source-motoren, er CPU-begrænset, næsten uanset detaljegrad og interface. Vi er, på intet tidspunkt over 4 % i difference, og nogle gange yder interfacet marginalt dårligere. Vi snakker altså her om et spænd på 1.2 GHz for CPU'en, alt på max. for grafikkort.

Nu kommer nemlig en af mine personlige kæpheste.

Source-motoren, uanset hvor lækker den ser ud, er en rigtig gammel engine. Dens skalérbarhed overgåes ikke af noget andet jeg kender til. I har her, ovenfor mine Damer og Herrer, det direkte bevis.

Du kan blive ved med at forøge din frame-rate på Source-motoren, så længe udstyret tillader det. Faktisk, så har det længe undret mig, hvorfor man ikke bruger Source-motoren til at benchmarke i. Den er langt mere skalérbar og gennemskuelig end eksempelvis motoren bag 3Dmark Vantage.

Da HL2 i sin tid kom ud, skulle det passe på så mange computere, som overhovedet muligt. I 2004 hed nogle af de bedste grafikkort Geforce Ti4600 og Radeon 9800pro - selvom mange stadigvæk sad med eksempelvis et Geforce 2. Det gav Valve (og til dels iD-software) en del kvaler, eftersom man var i en overgangsperiode. Mange af os kan nok huske Geforce5-fadæsen, hvor nVidia skød fuldstændigt ved siden af og afleverede en støvsuger, frem for et grafikkort.

Faktum var dog, at selvom vi havde disse enormt lækre grafikkort, så skulle dem med mindre systemer også være der. Derfor blev Source-motoren skrevet op omkring Directx7 API'en, og kunne faktisk køre rigtig godt på selv disse grafikkort. Nu kunne vi komme ud i en længere forklaring om sammensætningen af grafikmotorer, grafikkort, GFLOPS og jeg ved ikke hvad.

Jeg vil dog nøjes med at sige, at Counter-Strike:Source (hypotetisk set) kan køre lige så godt på en computer fra 2004, som det kører på en computer den dag i dag. Interfacet er i hvert fald ikke begrænsningen, og det er direkte aflæseligt at frame-raten styres af CPU'en og ikke grafikkortet (modsat CoD4).

 

Konklusion

 Så, hvad kan vi konkludere ud fra ovenstående?
- Først og fremmest, kan vi se, at der er sket noget af et skifte. For blot 2 år siden, ville de færreste have spået PCI-e 2.0 de store fordele, over PCI-e og AGP. Tingene har dog ændret sig siden, men selv dét er en sandhed med modifikationer. Nu sidder jeg, med et af markedets kraftigste grafikkort (Jo jeg gør så! Hold mund Wankermark3D-Wannabes) og havde faktisk ikke forventet den store forskel mellem PCI-e 2.0 8x og PCI-e 2.0 16x - Sagen forholder sig dog en anelse anderledes. Jeg ville langt fra kalde forskellen fra markant, men den er der.

Omvendt, så afhænger det også meget af hvilken titel vi kigger på. Det kan nok virke en anelse fladt at lave så generelt en konklusion, baseret på blot to titler. Men det var nu heller ikke min hensigt. Min hensigt var, at finde to spil i hver sin ende af "skalaen" (detaljegrad, workload og ikke mindst skalérbarhed) og se hvordan deres ydelse blev påvirket af hastigheden (båndbredde tilgængelig) på interfacet. Som du kan se, så bliver Source ikke påvirket så forfærdeligt meget. Der er en målbar forskel, den er ekstremt lille, men der er en målbar forskel.

Er den værd at notere?
- Det synes jeg ikke.

Ser vi på CoD4 alene, og sammenligner med nogle tungere drenge såsom Unreal 3 Engine, CryEngine2 osv. - er jeg ikke et sekund i tvivl om, at PCI-e 2.0 har en masse at give af. Vil sådanne spil (og ja, jeg snakker om spiltitler, ikke hardware nu) kunne udnytte den båndbredde? Jeg ville sige nej. Forskellen er i hvert fald ikke værd at hænge sig i. Ikke på nuværende tidspunkt. Ser man på de rå resultater, så er forskellen mellem PCI-e 2.0 16x og PCI-e 2.0 8x (emuleret PCI-e 1.1) på kun 3-4 FPS. Ikke engang forskellen mellem de forsk. CPU-hastigheder er værd at nævne (hint - grafikkortet er ikke CPU-belastet).

Så hvad er den overordnede konklusion?
- Den overordnede konklusion fra min side må være, at vi ikke skal hænge os så meget i forskellen mellem PCI-e 2.0 og PCI-e 1.1. Der er langt større varians mellem hvilken titel vi vælger, frem for hvilket interface vi gør brug af.

 


Afsluttende bemærkning

Det var alt for denne gang. En lille "hovsa"-artikel, der viste sig at optage det meste af min fredags-fridag. Men jeg føler, at jeg fik det ud af det jeg ville. Jeg har lavet et lille ekstra-afsnit, hvor resultaterne er præsenteret i tabelform.

Overordnet set, så er det her meget alá hvad du kan forvente af mine kommende tre artikler. Jeg vil i denne række af artikler delt op i tre, kigge lidt på CPU'ens betydning for frame-raten, såfremt den har nogen?

Jeg siger tak fordi du gad at læse med. Hvis der er noget du er (u)enig med mig i, er du meget velkommen til at smide en kommentar i tråden. Jeg tager seriøse henvendelser seriøst og useriøse henvendelser useriøst. Så lad mig høre om du fik noget ud af det, og om det kan bruges til noget.

Tak for nu og fortsat god dag.

Med venlig hilsen
Allan "NoNig" Meineche

Wise
 
Elitebruger
Tilføjet:
01-03-2009 09:23:23
Svar/Indlæg:
1604/60
Sjov lille artikel og god læsning, har selv tænkt lidt over de forskellige "hastigheder" godt skrevet 🙂


besse
 
Elitebruger
Tilføjet:
01-03-2009 10:06:16
Svar/Indlæg:
1326/83
Fed læsning tak for det 😀


Frankness
 
Elitebruger
Tilføjet:
01-03-2009 10:09:44
Svar/Indlæg:
214/13
Fed læsning 🙂

lige et hurtigt spørgsmål. hvor mange hz køre pci-e porten med?


krikke
 
Elitebruger
Tilføjet:
01-03-2009 10:18:37
Svar/Indlæg:
2335/16
Lærerrig artikel 🙂 tak for den.


Clintin
 
Superbruger
Tilføjet:
01-03-2009 10:18:49
Svar/Indlæg:
1317/46
Fin opdatering i forhold til Toms artikler. Og du har ret Source enginen er intet mindre end imponerende, je mindes stadigt en anmeldelse af HL2, dengang det udkom, af en som sad med et ATI radeon 8500 og havde en god oplevelse med grafikken(og spillet i øvrigt).


teko
 
Elitebruger
Tilføjet:
01-03-2009 10:36:31
Svar/Indlæg:
873/19
Call og duty i %, er der ikke en fejl ved 16x? Skulle der ikke have været et ciffer mere? Ellers en fed idé at teste det :)


jakob3k
 
Superbruger
Tilføjet:
01-03-2009 11:13:41
Svar/Indlæg:
440/3
Fin artikel og spændende læsning. Dog har jeg lige lidt konstruktiv kritik.

Mht. graferne ville det være lækkert, hvis du gav dem samme farveforløb som i "farveforklaringen" ude til højre i stedet for omvendt, som det er nu.

Desuden ville det på mig have virket mere logisk, hvis du i stedet for procentafvigelse havde valgt noget indeks-halløj, altså f.eks. havde sat 1x-tallene til indeks 100. Som det er nu, blev jeg i hvert fald lidt forvirret, da jeg kom til procentgraferne. Umiddelbart er det ikke til at se, i hvilken rækkefølge de skal læses, og normalt læser vi jo oppefra og ned.

Det var vist min kritik for i dag. Jeg ser frem til dine næste "hovsa-artikler"! 🙂


Sir
 
Elitebruger
Tilføjet:
01-03-2009 11:21:45
Svar/Indlæg:
2872/90
#0 tak for en god morgen læsning Nonig..

Kunne være fedt hvis du kunne lave den samme test med et nvidia kort.. 🙂


Mentos3
 
Elitebruger
Tilføjet:
01-03-2009 11:52:25
Svar/Indlæg:
4230/89
ja ganske udemærket lige at vågne op på her en søndag middag 🙂


Bullerbums
 
Overclocker
Tilføjet:
01-03-2009 12:53:33
Svar/Indlæg:
23/2
God artikel :)
Giver lidt stof til eftertanke


Spear
 
Elitebruger
Tilføjet:
01-03-2009 14:26:21
Svar/Indlæg:
564/13
Tak for en fin artikel. 🙂


NoNig
 
Elitebruger
Tilføjet:
01-03-2009 15:47:59
Svar/Indlæg:
23132/740
-> Alle

Mange tak for de rosende ord 🙂

-> #3

Så vidt jeg ved, så kører den 100 MHz (2.500 MHz effektivt) og transporterer 500 MB/s pr. lane. Det er for den nye PCI-e 2.0 standard. Den gamle kører ved halv hastighed af dét.

-> #6

Jeg er ikke sikker på, at jeg forstår? 🙂

-> #7

Det kan du jo så have ret i. Jeg er desværre ikke den store haj til Open Office Excel-wannabe, og rodede lidt med det. Jeg kan godt prøve at smide nogle lidt mere læsevenlige grafer op, på et senere tidspunkt 🙂

Indekstallene, er for at angive forskellen over den forrige PCI-e hastighed. Forstået på den måde, at tallet for PCI-e 2.0 16x - er forskellen over PCI-e 2.0 8x. Tallet ved 8x er fordelen over 4x og så videre og fremdeles.

Hvis jeg angiver forskellen, i forhold til "base"-scoren, vil man se procentangivningen gå op, og ikke ned - hvilket ikke var det jeg ville vise. Jeg ville se, om 8x og 16x havde under 5 % i forskel, hvilket de jo så også viste sig at have - for CoD4.

Hvorom alting er, så kan jeg godt se hvad du mener og hvordan du gerne ville have det angivet. Jeg føler bare, at det er en anelse misvisende, da man derved skulle diskutere, at 16x er ~210 % bedre end 1x og 8x "kun" er 200 % bedre.

Det viser ikke forskellen mellem 16x og 8x, men derimod hvor meget bedre 8x og 16x er end 1x.

(Pyha. Sikke en mase x'er).

Håber det gav mening? Hvis ikke, må du lige sige til 🙂

-> #8

Hvorfor også med nVidia kort? 🙂


Kaffe
 
Superbruger
Tilføjet:
02-03-2009 08:00:55
Svar/Indlæg:
422/10
NoNig. jeg syndes sgu det en god stykke "arbejde" du har fået fra hånden der, da jeg selv har søgt forklaringerne på forskellen og hvad "mærkbar" forskel der ville være. men efter 4 timmers søgen og 7 artikler på tysk, engelsk og svensk gav jeg op og fik egenligt ikke lært særligt meget ved det.

ser da frem til de andre artikler 😀


PayDay
 
Superbruger
Tilføjet:
02-03-2009 09:20:10
Svar/Indlæg:
277/8


Tak for en fin artikel. 🙂


Johnny
 
Superbruger
Tilføjet:
02-03-2009 12:40:14
Svar/Indlæg:
2127/11
Ligersom #7 blev jeg også forvirret da jeg nåede til procentangivelsen.

Men mest mangler jeg en test af en lidt anden parameter, nemlig fps drop. Når gfx løber tør for texturer, og der skal overføres nyt materiale til det. Er der forskel ml de forsk. interfaces i "omkostning" for ham der sidder og spiller? Hjælper den højere båndbredde til at få flyttet tingene i en ruf? Ikke vurderet ud fra min,max,avg som Fraps leverer, for de tal er reelt ikke meget værd. Nej set på ift en udregning af den reelt laveste fps. Lagger en pci-e 2 mindre end de tidligere interfaces?


Men for dælen det er sejt at du er begyndt at arbejde på disse alternative ting, som stort set ingen beskæftiger sig med. Jeg ser frem til hvad du ellers har i støbeskeen Allan.


anru2007
 
Elitebruger
Tilføjet:
02-03-2009 14:37:00
Svar/Indlæg:
5891/423
god artikel! 😀

OG ja, mythbusters er naaice 😛


#17
1EaR
 
Elitebruger
Tilføjet:
02-03-2009 22:18:25
Svar/Indlæg:
5750/124
Nice artikel, det eneste som jeg kunne finde ganske ok (også selvom du vil hade mig for det), så en test i en af de virkelig tunge spil, fx UT3 eller Spillene med CryEngine2, for at se om disse tunge spil vil kunne trække noget mere fra PCI-E 1.1 til 2.0 😳


Ciric
 
Elitebruger
Tilføjet:
03-03-2009 11:36:34
Svar/Indlæg:
1881/22
Absolut spændende læsning, som giver lidt stof til eftertanke. -godt arbejde!
...som eftertest, kunne det være fedt hvis du/i, kunne få tid og mulighed for at teste med nogle noget mindre kort. -for at finde grænsen for hvornår det er kortet og ikke bussen, som sætter grænsen. Ved godt at det formentlig er "out of reach" for en side som HWT 😉 Det er trods alt en hel del test som skal laves.

#17: Mht til CryEngine2 må man, imo, formode at du får ca samme resultat som i CoD4


Nikki
 
Overclocker
Tilføjet:
03-03-2009 19:43:31
Svar/Indlæg:
119/20
NoNig

mange tak for denne meget oplysende tråd 😀
det er et emne som ejg ikke selv har været sikker på, og fik lært en del ved at få læst dette 😎

Thumps up her fra


Fafler
 
Superbruger
Tilføjet:
03-03-2009 22:07:09
Svar/Indlæg:
34/9
Jeg har rodet lidt med det under Linux. De konkrete resultater har jeg ikke lige her, men hardwaren er to Quadro NVS 290 (svarer til 8400GS) kort ved hhv. 1x og 16x og softwaren Doom 3 (gammel hardware og gammel software). Ud fra de tal jeg har fået handler det mest om hvor meget RAM der er på kortet. Hvis der er rigeligt betyder båndbredden ikke så meget, hvorimod hvis man begrænser den er straffen meget stor ved den lavere hastighed, Frit fra hovedet tror jeg det er noget med 64 fps@1x vs. 66 fps@16x i ultra når begge kort får lov at bruge deres 256 mb. Faktisk blev jeg noget overasket over at forskellen var SÅ lille.

Iøvrigt... hvis nogen har brug for at bruge et 16x (eller mindre) kort i et 1x slot, så tag en hobbykniv og skær enden af slottet og lad resten af kortet hænge ud. Det kræver selvfølgelig der ikke sidder andre komponenter i vejen, men det virker 100% stabilt her.


NoNig
 
Elitebruger
Tilføjet:
08-03-2009 17:47:26
Svar/Indlæg:
23132/740
-> #13

Der skulle gerne være noget læsning om en måneds tid 🙂

-> #14

Tusind tak 🙂

-> #15

Procentangivelsen er, synes jeg selv, ret simpelt udformet. Den viser avancen i procent, for hver gang du fordobler båndbredden.

Jeg kender kun til et enkelt spil, hvor der bliver flyttet enormt meget data mellem harddisk og grafikkort, og det er pt. kun 'Crysis'. Men i så fald, vil selv PCI-e 1.0 1x være tilstrækkelig med sine 250 MB/s - I hvert fald så vidt jeg kan forstå på tingene.

Det kunne være en interessant ting at kigge nærmere på.

Scheea2000 og jeg, sad og snakkede om det på CeBIT-turen, og jeg har en idé om, at han kan bidrage med en masse teknisk viden. Han er jo trods alt ingeniør inden for området. Og tusind tak 🙂

-> #16

Tusind tak 🙂

-> #17

Tusind tak.

Det vil de ikke (eller: det forventer jeg ikke, at de vil). I hvert fald ikke markant meget. Er det noget du gerne vil se nogle tal på? I så fald, hvorfor? Hvordan indstiller du disse spil, og hvorfor netop inddrage disse? 🙂

Min umiddelbare tanke ville være, at vi snakker så marginale forskelle, at det kan være ligemeget. Så burde jeg, i så fald, overveje at køre samtlige tests på de mest udbredte engines... det orker jeg simpelthen ikke 😳

-> #18

Både og. Jeg har et HD3870 til at ligge, som jeg i regelen kunne køre de samme tests på. Omvendt, så kunne jeg ligeledes inddrage et GTX280 - men så snakker vi i hvert fald yderligere 360 benchmarks (180 x 2) - så der er til et par dage. Det kunne nok godt være interessant, men jeg forventer ikke at enkelte grafikkort (inden for samme teknologi) benefitter mere end andre.

Jeg kan prøve at kigge lidt nærmere på det, før jeg afgiver en endelig dom over problemstillingen.

Og jeg er enig. Jeg tror ikke at CryEngine2 vil vise den store forskel. Der er nok mere forskel mellem ATi og nVidia, end der er imellem netop de to engines.

-> #19

Tusind tak 🙂

-> #20

Selvfølgelig vil vRAM betyde en del i store opløsninger med al øjenguf slået til. Større teksturer kræver mere hukommelse.

Til sekundære kort, ville jeg hellere købe en PCI-e 1x -> 16x riser card, frem for at bryde garantien ved den slags. Evt. blot købe et dual 16x bundkort, og køre med to grafikkort 🙂