Specifikationer
Fra specifikationerne kan vi se, at MSI har hævet clockhastigheden 114 MHz i Gaming mode, hvilket er kortets standardindstilling. Igen ser vi at MSI ikke har valgt at hæve hastigheden på Ram, de resterende specifikationer kigger vi nærmere på i Design / Layout.
Innovation/Teknologi
Nvidia har taget designelementerne som blev introduceret under kodenavnet Maxwell, der kom på markedet i form af Geforce 750 og lagt flere nyskabelser oveni. Maxwell designet var revolutionerende pga. sit lave energiforbrug, men Maxwell 2 har en del nye features som i kan læse om nedenfor. Maxwell er opkaldt efter James Clerk Maxwell som var en teoretisk fysiker fra Scotland som udledte et sæt af fire partielle differentialligninger om elektromagnetisme som senere er blevet meget berømte.
Maxwell 2 med alle de nye features, blev introduceret i form af chipdesignet GM204 (Geforce GTX 980), og er fremstillet på 28nm processen, hvilket gør at Nvidia ikke har kunnet få nogen forbedring af ydelsen ved at skrumpe chippen. Finere dimensioner i fremstillingsteknologien har ellers traditionelt har været en sikker vej til højere ydelse. Geforce 960 bruger chipdesignet GM206, der stort set er GM204 der er hugget midt over. GM206 chippen har 2,94 milliarder transistorer, så lidt under halvdelen af hvad GTX 980 har.
GM206 består af 2 Graphics Processing Clusters (GPCs), 8 Streaming Multiprocessors (SMM) og to hukommelses kontrollere. Hver SMM har 128 CUDA cores, en PolyMorph Engine der styrer skeduleringen af compute waves og shader instuktioner, og 8 texture units. Med 8 SMMs, får GeForce GTX 960 i alt 1024 CUDA cores og 64 texture units. Hver af de to 64-bit hukommelses controllere er forbundet til 16 ROP units og 512KB L2 cache. Derved får chippen i alt 32 ROPs og 1024KB L2 cache og 128-bit samlet busbredde.
I forhold til Kepler arkitekturen fra Geforce 680 er hver SMM blevet redesignet til at være mere effektiv. Det betyder at hver CUDA core kan udnyttes bedre og at man tit vil se højere ydelse med Maxwell, selvom Kepler har flere cores.
Video encoder blokken er også blevet opgraderet, så man kan encode H.264 video i 4K opløsning med 60 frames per sekund. Maxwell 1 understøttede ‘kun’ 1080p opløsning.
Instruktioner til acceleration af voxel operationer
Chippen introducerer nogle nye instruktioner der er beregnet til at accelerere voxel operationer. Voxels kan tænke på som tredimentionelle pixels, akkurat som geometrien i Minecraft spillet. Ved at rasterisere geometri der normalt er lavet af trekanter til voxels, kan man omdanne scenen til en datastruktur som er meget lettere for en GPU at traversere effektivt. Når man nu har denne datastruktur på GPUen kan man implementere interessante algoritmer, såsom Global Illumination. Disse vil også virke på ældre GPUer men med de nye instruktioner bliver de meget hurtigere og det kan være forskellen på om det er brugbart i spil eller for langsomt. Hardware acceleration af multiprojection, altså teknikken hvor man sender geometrien til rasterisering i flere render targets på én gang, er med til at gøre voxel operationer hurtigere.
Konservativ rasterisering er en anden ny feature i Maxwell, hvor man danner en ny pixel hvis der er selv det mindste overlap mellem pixel og geometri. Almindelig rasterisering kræver at centrum af pixelen er dækket af geometrien. Det er anvendeligt til nogle typer lysberegninger f.eks. når man beregner radiosity.
Programmerbare sample positioner til antialiasing
Tidligere har de subpixel positioner i hver pixel hvor shaderen sampler texture-værdier været foruddefineret, da man bruger et standardiseret mønster som blev lagt i ROM når man fremstillede chippen. Det nye med Maxwell 2 er at de kan læses fra RAM og derved ændres hver frame.
Ved at ændre sampling mønstret hver frame kan man undgå nogle af de klassiske problemer med MSAA, nemlig de trappeformede kanter. Man vil få støj i stedet for hakker, men det er mere behageligt at kigge på. Dette giver mulighed for at implementere nogle spændende algoritmer, hvor man fx kombinerer samples fra flere frames f.eks. til rotated grid, temporal antialiasing.
Hukommelseskompression
Teknologien til hukommelseskompression er nu ude i tredje iteration, med flere muligheder for delta komprimering. Blokke af pixels bliver tabsfrit komprimeret, før de skrives ud til DRAM. Dette gør at mindre data skal sendes og båndbredden derfor udnyttes mere effektivt. Nvidia fortæller os at bustrafikken er reduceret med ca. 25% i forhold til Kepler designet.
Komprimeringen betyder at selvom GTX 960 kun har en 128-bit bus, er der effektivt set lige så høj båndbredde som en GK106 Kepler GPU med en 192-bit bus. Man kan vise det sådan her 112Gbps * (1/75%) = 149 Gbps “effektiv båndbredde”.
På næste side ser vi på kassens indhold.