Specifikationer
Kortets clockhastighed er hævet med 140 Mhz, sammenlignet med NVIDIA's standard specifikationer. Inno3D skriver også at kortet kun understøtter 2-way SLI på trods af, at det har 2 SLI porte, hvilket normalt giver mulighed for 3 eller 4-way SLI. De nævner også kravet om fleksible SLI broer, dette forklarer jeg nærmere i Design / Layout.
Innovation/Teknologi
NVIDIA har taget designelementerne som blev introduceret med GeForce 750 og lagt endnu flere nyskabelser oveni. GeForce 750 chippen som også kendes under kodenavnet Maxwell var revolutionerende pga. sit lave energiforbrug men Maxwell 2 kan nogle flere tricks som i kan læse nedenfor. Maxwell er opkaldt efter James Clerk Maxwell som var en teoretisk fysiker fra Scotland som udledte et sæt af fire partielle differentialligninger om elektromagnetisme som senere er blevet meget berømte.
Maxwell 2 med chipdesignet GM204 som GTX 980 også kaldes, er stadig fremstillet på 28nm processen, hvilket gør at NVIDIA ikke har kunnet få nogen forbedring af ydelsen ved at skrumpe chippen. Finere dimensioner i fremstillingsteknologien har ellers traditionelt har været en sikker vej til højere ydelse. Chippen har 5,2 milliarder transistorer klemt ned på 398 kvadratmillimeter.
GM204 består af 4 Graphics Processing Clusters (GPCs), 16 Streaming Multiprocessors (SMM) og fire hukommelses kontrollere. Hver SMM har 128 CUDA cores, en PolyMorph Engine der styrer skeduleringen af compute waves og shader instuktioner, og 8 texture units. Med 16 SMMs, får GeForce GTX 980 i alt 2048 CUDA cores og 128 texture units. Hver af de fire 64-bit hukommelses controllere er forbundet til 16 ROP units og 512KB of L2 cache. Hele chippen har i alt 64 ROPs og 2048KB L2 cache og 256-bit samlet busbredde.
I forhold til Kepler arkitekturen fra Geforce 680 er hver SMM blevet redesignet til at være mere effektiv. Det betyder at hver Cuda core kan udnyttes bedre og at man tit vil se højere ydelse med Maxwell, selvom Kepler har flere cores.
Video encoder blokken er også blevet opgraderet, så man kan encode H.264 video i 4K opløsning med 60 frames per sekund. Maxwell 1 understøttede max 1080p opløsning.
Instruktioner til acceleration af voxel operationer
Chippen introducerer nogle nye instruktioner der er beregnet til at accelerere voxel operationer. Voxels kan tænke på som tredimentionelle pixels, akkurat som geometrien i Minecraft spillet. Ved at rasterisere geometri der normalt er lavet af trekanter til voxels, kan man omdanne scenen til en datastruktur som er meget lettere for en GPU at traversere effektivt. Når man nu har denne datastruktur på GPUen kan man implementere interessante algoritmer, såsom Global Illumination. Disse vil også virke på ældre GPUer men med de nye instruktioner bliver de meget hurtigere og det kan være forskellen på om det er brugbart i spil eller for langsomt.
Hardware acceleration af multiprojection, altså teknikken hvor man sender geometrien til rasterisering i flere render targets på én gang, er med til at gøre voxel operationer hurtigere.
Konservativ rasterisering er en anden ny feature i Maxwell, hvor man danner en ny pixel hvis der er selv det mindste overlap mellem pixel og geometri. Almindelig rasterisering kræver at centrum af pixelen er dækket af geometrien.
Programmerbare sample positioner til anti-aliasing
Tidligere har de subpixel positioner i hver pixel hvor shaderen sampler texturens værdi været foruddefineret, da man bruger et standardiseret mønster som blev lagt i ROM når man fremstillede chippen. Det nye med Maxwell 2 er at de kan læses fra RAM og derved ændres hver frame.
Ved at ændre sampling mønstret hver frame kan man undgå nogle af de klassiske problemer med MSAA, nemlig de trappeformede kanter. Man vil få støj i stedet for hakker, men det er mere behageligt at kigge på. Dette giver mulighed for at implementere nogle spændende algoritmer, hvor man fx kombinerer samples fra flere frames f.eks. til rotated grid, temporal anti-aliasing.
Hukommelseskompression
Teknologien til hukommelseskompression er nu ude i tredje iteration, med flere muligheder for delta komprimering. Blokke af pixels bliver tabsfrit komprimeret, før de skrives ud til DRAM. Dette gør at mindre data skal sendes og båndbredden derfor udnyttes mere effektivt. NVIDIA fortæller os at bustrafikken er reduceret med ca. 25% i forhold til Kepler designet.
På næste side ser vi på kassens indhold.