Test: Gigabyte GV-N970G1 GAMING

Grafikkort, NVIDIA  d.  11. november. 2014, skrevet af SDK 7 Kommentarer.  Vist: 13768 gange.

Korrekturlæser: jmose
Billed behandling: 
Oversættelse: jmose

Pristjek på Grafikkort hos PriceRunner 2843,00
Produkt udlånt af: Gigabyte
DK distributør: Fourcom

Innovation/Teknologi

Nvidia har taget designelementerne som blev introduceret med Geforce 750 og lagt endnu flere nyskabelser oveni. Geforce 750 chippen som også kendes under kodenavnet Maxwell var revolutionerende pga. sit lave energiforbrug men Maxwell 2 kan nogle flere tricks som i kan læse nedenfor. Maxwell er opkaldt efter James Clerk Maxwell som var en teoretisk fysiker fra Scotland som udledte et sæt af fire partielle differentialligninger om elektromagnetisme som senere er blevet meget berømte.

Maxwell 2 med chipdesignet GM204 som GTX 980 og GTX 970 også kaldes, er stadig fremstillet på 28nm processen, hvilket gør at Nvidia ikke har kunnet få nogen forbedring af ydelsen ved at skrumpe chippen. Finere dimensioner i fremstillingsteknologien har ellers traditionelt har været en sikker vej til højere ydelse. Chippen har 5,2 milliarder transistorer klemt ned på 398 kvadratmillimeter.
 


 

GTX 970 består af 4 Graphics Processing Clusters (GPCs), 13 Streaming Multiprocessors (SMM) og fire hukommelses kontrollere. Hver SMM har 104 CUDA cores, en PolyMorph Engine der styrer skeduleringen af compute waves og shader instuktioner, og 8 texture units. Med 113 SMMs, får GeForce GTX 970 i alt 1664 CUDA cores og 104 texture units. Hver af de fire 64-bit hukommelses controllere er forbundet til 16 ROP units og 512KB of L2 cache. Hele chippen har i alt 64 ROPs og 2048KB L2 cache og 256-bit samlet busbredde.

I forhold til Kepler arkitekturen fra Geforce 680 er hver SMM blevet redesignet til at være mere effektiv. Det betyder at hver Cuda core kan udnyttes bedre og at man tit vil se højere ydelse med Maxwell, selvom Kepler har flere cores.

Video encoder blokken er også blevet opgraderet, så man kan encode H.264 video i 4K opløsning med 60 frames per sekund. Maxwell 1 understøttede max 1080p opløsning.
 

Instruktioner til acceleration af voxel operationer

Chippen introducerer nogle nye instruktioner der er beregnet til at accelerere voxel operationer. Voxels kan man tænke på som tredimensionelle pixels, akkurat som geometrien i Minecraft spillet. Ved at rasterisere geometri der normalt er lavet af trekanter til voxels, kan man omdanne scenen til en datastruktur som er meget lettere for en GPU at traversere effektivt. Når man nu har denne datastruktur på GPUen kan man implementere interessante algoritmer, såsom Global Illumination. Disse vil også virke på ældre GPUer men med de nye instruktioner bliver de meget hurtigere og det kan være forskellen på om det er brugbart i spil eller for langsomt.

Hardware acceleration af multiprojection, altså teknikken hvor man sender geometrien til rasterisering i flere render targets på én gang, er med til at gøre voxel operationer hurtigere.
 


 

Konservativ rasterisering er en anden ny feature i Maxwell, hvor man danner en ny pixel hvis der er selv det mindste overlap mellem pixel og geometri. Almindelig rasterisering kræver at centrum af pixelen er dækket af geometrien.

 

Programmerbare sample positioner til antialiasing

Tidligere har de subpixel positioner i hver pixel hvor shaderen sampler texturens værdi været foruddefineret, da man bruger et standardiseret mønster som blev lagt i ROM når man fremstillede chippen. Det nye med Maxwell 2 er at de kan læses fra RAM og derved ændres hver frame. 



 

Ved at ændre sampling mønstret ved hver frame kan man undgå nogle af de klassiske problemer med MSAA, nemlig de trappeformede kanter. Man vil få støj i stedet for hakker, men det er mere behageligt at kigge på. Dette giver mulighed for at implementere nogle spændende algoritmer, hvor man fx kombinerer samples fra flere frames f.eks. til rotated grid, temporal antialiasing. 

 

Hukommelseskompression 

Teknologien til hukommelseskompression er nu ude i tredje iteration, med flere muligheder for delta komprimering. Blokke af pixels bliver tabsfrit komprimeret, før de skrives ud til DRAM. Dette gør at mindre data skal sendes og båndbredden derfor udnyttes mere effektivt. Nvidia fortæller os at bustrafikken er reduceret med ca. 25% i forhold til Kepler designet.

Hapsdog1
 
Overclocker
Tilføjet:
11-11-2014 10:53:40
Svar/Indlæg:
294/19
Jeg fik også fingrene i sådan et kort og det er det fedeste gfx jeg har ejet, det overgår langt mit hd7990.

Svaret blev redigeret 1 gang, sidst af Hapsdog1 d. 11-11-2014 10:53:52.


noxon
 
Elitebruger
Tilføjet:
11-11-2014 15:45:28
Svar/Indlæg:
3321/21
Lækkert kort og god gennemgang 🙂
I burde dog opgive GPUens frekvens efter den faktiske hastighed, den kan kun aflæses under load, fx i grafen i afterburner.

Grunden er, at frekvensen pga boost, evt throttle og varme ikke passer med hvad GPU-Z "gætter" sig til.

2 ens kort kan sagtens have en forskel på 40-80MHz, især ved OC, selvom GPU-Z siger de kører med samme frekvens.

Lige et eksempel med mit 660Ti, som i øvrigt skal have skiftet kølepasta kan jeg se 🤡



SDK
 
Redaktør
Tilføjet:
11-11-2014 16:56:10
Svar/Indlæg:
573/108
#2 Har jeg også kigget på. Men de nye kort (De 970 jeg har testet) med meget effektive kølere, kører faktisk den opgivne hastighed da chippen aldrig bliver varm nok, til at throttle ned.


noxon
 
Elitebruger
Tilføjet:
11-11-2014 17:21:38
Svar/Indlæg:
3321/21
#3
Jeg har nu set flere eksempler på det modsatte, varme har ikke været problemet. -Men at GPU-Z læser fra nogle tabeller, og ikke den faktiske frekvens.

Anyways, du mener stadig at GPU frekvensen er 1178MHz(std) og 1358MHz(OC), under load?
-Det er nok tættere på de oplyste Boost frekvenser, altså 1329MHz(std) og 1509MHz(OC).

Her er et Gigabyte GTX 970, hvor GPU-Z siger 1509MHz, men hvor den faktiske frekvens under load er 1584MHz:
http://hwbot.org/submission/26...


Gripen90
 
Senior Skribent
Tilføjet:
11-11-2014 18:54:27
Svar/Indlæg:
15982/637
#4: CPU-z læser kun den "faste boost frekens" og ikke en max. Max boost kan jo variere fra spil til spil.


noxon
 
Elitebruger
Tilføjet:
12-11-2014 09:50:01
Svar/Indlæg:
3321/21
#5
Men her er det jo ikke engang boost clocken der er opgivet, men den 150MHz lavere GPU Clock. Så kan den reelle frekvens i princippet, være alt mellem ~1100-1600MHz.

Jeg har erfaret, at den frekvens afterburner oplyser, er den samme uanset spillet (belastningen).
-Og hvis man ikke vil oplyse denne, så er Boost clocken i GPU-Z ihf. mere korrekt end GPU Clocken.

Dog med undtagelse af et OC der er så tæt på powerlimit, at clocken under spidsbelastning hopper ned for at holde TDP i skak. Varme gør det samme, men skulle ikke gerne være et problem med et kort i denne klasse, der ikke sveder i SLI!


Undskylder for alt dette OT og mit detaljeknepperi 🤡 🤡
Men jeg synes det er vigtigt, at der er et ordentligt sammenlignings grundlag. Ellers bliver det jo bare hokuspokus, hvorfor det ene kort yder bedre end det andet.


Gripen90
 
Senior Skribent
Tilføjet:
12-11-2014 11:48:28
Svar/Indlæg:
15982/637

#5
Men her er det jo ikke engang boost clocken der er opgivet, men den 150MHz lavere GPU Clock. Så kan den reelle frekvens i princippet, være alt mellem ~1100-1600MHz.

Jeg har erfaret, at den frekvens afterburner oplyser, er den samme uanset spillet (belastningen).
-Og hvis man ikke vil oplyse denne, så er Boost clocken i GPU-Z ihf. mere korrekt end GPU Clocken.

Dog med undtagelse af et OC der er så tæt på powerlimit, at clocken under spidsbelastning hopper ned for at holde TDP i skak. Varme gør det samme, men skulle ikke gerne være et problem med et kort i denne klasse, der ikke sveder i SLI!


Undskylder for alt dette OT og mit detaljeknepperi 🤡 🤡
Men jeg synes det er vigtigt, at der er et ordentligt sammenlignings grundlag. Ellers bliver det jo bare hokuspokus, hvorfor det ene kort yder bedre end det andet.

noxon skrev d. 12-11-2014 09:50:01


Ah havde ikke set at boost clock ikke var oplyst men jo så er det rigtigt.

Boost clocken kan variere alt efter spil da GPU Boost 2.0 regulere alt ml. volt, varme og Mhz samtidigt. Men da GTX 970 er en rimelig ok kølig chip så burde den også kunne holde max boost clock i de fleste tilfælde.
Min egen boost clock svinger ml. 1345~1360MHz, men nu har jeg så også 3 kort GPU Boost 2.0 regulerer på samtidig. Min anden PC med 2 kort ligger den rimelig fast på 1395Mhz 99% af tiden.