Afsnit venligst udlånt af red_martians: Chipdesign
En chips vigtigste egenskab er at producerer pixels. Jo flere desto bedre. Her kommer Mhz og pixelpipelines ind i billedet. Én pixelpipeline beskriver, at den kan producere en pixel per Hz. 8pixelpipelines betyder så den kan producerer op til 8pixels per Hz osv. osv. I dag er det dog ikke unormalt at en pixel skal beregnes flere gang og at for at hastigheden kan holdes oppe, skal der støttes op af andre avancerede egenskaber som vertexshader-pipelines. Samtidig skærer producenterne i chippens transistorer for at holde prisen nede og bevare mest muligt af den oprindelige hastighed. Det ødelægger oftest den mest grundlæggende teori om pipelines og MHz og gør det svært at forklare en chips tekniske egenskaber. Men vi prøver alligevel:)
Chipdesignet i 7600GT minder utroligt meget om en halv Geforce7800/7900-chip. Chippen har dog fem vertexshadere, hvor et 7900GT/GTX har 8.
Derunder ser vi de 12pixelpipelines placeret i det man kalder tre quads. Det betyder at der er tre blokke med 4pipelines, hvilket gør at producenten kan deaktivere dele af chippen i produktionen, hvis noget er defekt (7800GT har teknisk set 24pipelines, men en quad er deaktiveret og derfor har den kun 20 funktionelle, hvilket giver lidt dårligere ydelse).
Det mest interessante ved disse pipelines er, at de har to stk mini-ALU'er per pipeline. Den ene er en rigtig ALU, den anden er en seriøst handicappet én. ALU'ernes vigtigste funktion er at lave realistiske overflader og 7600GT har altså 12 af slagsen og i særlige tilfælde 24. Disse 12/24ALU's kan altså lave op til 24 pixels med realistisk overflader per clock.
Den nederste blok er de 8ROPs. De betyder at den kan skrive 8pixels til hukommelsen og dermed skærmen og hvorfor skal den så kunne tage op til 24shader-pixels-per clock? Jo af den simple grund at en pixel i dag behandles flere gange inden den ryger på skærmen. Alle de flotte skærmeffekter tager mere end en clockcyklys og sløver kortet en del. Der er altså ingen grund til at lave flere ROPs, hvis de ikke benyttes. Det ville være spild af transistorer.
Sammenligning med andre kort
GeForce7600GT skal især tage over for 6800GS og til dels 6600GT, og kan mange gange vise sig som en værdig afløser for 6800Ultra serien. På mange områder ser chippen svagere ud end GeForce6800GS og 6800Ultra. Især rammene er blevet handicappet pga. de kun kan arbejde i 128bit, dvs. halv båndbredde per Mhz i forhold til f.eks. 6800GS. Men 7600GT arbejder dog med lidt flere Mhz, hvilket dog slet ikke er nok til at få rammene op i samme hastighed.
Egenskaber
Afsnittet om egenskaber venligst udlånt af red_martians: Egenskaber
De mest brugte egenskaber er klart Full Scene AntiAliasing (Forkortet FSAA) og Anisotrofisk filtrering (Forkortet ANI eller AF) som vi vil gennemgå her. Vi kigger også kort på Video-egenskaber og dualgraphics (kaldet SLi eller CrossFire)
FSAA
nVidia bruger flere former for antialiasing. Antialiasing er en egenskab der udjævner grimme pixelovergange, fjerner blinkende pixels og får billedopløsningen til at virke væsentligt højere end, hvad den egentlig er. Dette gøres kort fortalt ved at lave et meget større billede end det der kan vises på skærmen, for derefter at skalere det ned, ved at blænde pixels, til den indstillede opløsning. Der er mange måder at gøre det på, nogle effektive og andre hurtige. De fleste firmaer bruger i dag Multisample pga. det er hurtigst. Det gør nVidia også i de fleste tilfælde, men i nogle tilfælde blander nVidia Multisample sammen med den langsommere, men mere effektive supersampling.
NVidia har følgende metoder ud over den sædvanlige "multisample" antialiasing:
Gamma Correct FSAA
TSAA og TMAA
Q-FSAA
S-FSAA
Gamma Correct FSAA er en egenskab, der er dukket op med GeForce7-serien. Men faktisk er det ikke noget nyt fænomen. ATi har nemlig brugt det som standard de sidste mange år, og blev faktisk introduceret sammen med Radeon9500/9700-serien. Først nu har nVidia indbygget denne egenskab i deres chips. Hvordan det fungerer er temmelig indviklet forklaring, men hele idéen ligger i, at FSAA får et mere korrekt udseende. Det gøres ved at chippen kan justere op og ned for lysforholdene omkring FSAA-beregningerne, hvilket er med til at give en flottere overgang.
TSAA og TMAA (Transparency Multisample/Supersample AntiAliasing) er faktisk præcist det samme som ATi's AAA(Adaptiv AntiAliasing). Ideen er meget simpelt at fjerne en af de sidste rester af multisamples svagheder. Nemlig at de ikke kan antialiasere textures(overflader). Dette gør at transperente overflader som vinduer, hegn, gitter osv. ikke får sin portion af FSAA. Det laver TSAA/TMAA om på. TSAA giver klart det flotteste resultat, hvor TMAA giver bedst ydelse. Ydelsesforskellen mellem almindelig FSAA, TSAA og TMAA er dog så lille at jeg kun kan anbefale TSAA.
2x Q-FSAA (Quinqunx FSAA) er noget nVidia har brugt siden GeForce3-tiden. Selve metoden er ikke særlig køn, men til gengæld meget hurtig. Udseendet minder i høj grad om 4x FSAA, men ydelsen ligger som med 2x. Til gengæld må man leve med et grumset billede, der er bieffekten ved at gøre det så hurtigt. Metoden bruger nemlig kun 2xFSAA som navnet antyder, men bruger også sin nabo-pixels til at finde sin farve, hvilket gør at billedet virker lidt rystet og uskarpt, især i lave opløsninger.
S-FSAA(Super Full Scene AntiAliasing) er en teknik, der bruges i to tilfælde. Den mest brugte er nok 8xS-FSAA. Den vælges som højeste FSAA-niveau med single grafikkort. S-står for Supersampling og er en teknik, hvor billedet fysisk laves større. 4 x Supersampling i en opløsning på 1600x1200 vil svare til at grafikkortet arbejde med 3200x2400 eller 4gange så mange pixels. Multisample arbejder på et meget lavere niveau og er derfor ikke i nærheden af at være så tungt. Men nVidia understøtter ikke højere multisample end 4x. For at nå højere kombinerer man 2xSupersampling med 4x multisampling og opnår derved ca. 8xFSAA. Samme metode bruges i SLi (beskrevet længere nede), hvor men bruger samme teknik, men fra to grafikkortkort. Her opnår man 8xS-FSAA og 16xS-FSAA
Filtrering
Anistrofisk Filtrering er næsten uundværligt i dag. Har man prøvet det, går man aldrig væk fra det igen. Et 3D-billedes vigtigste egenskab er dybden, men også den mest besværlige for producenterne. Billedet består af mange forskellige overflader(kaldet textures) vejen er f.eks. én, græset en anden, og selv bladet på træet har sin egen overflade. Overfladerne har ofte gigantisk opløsninger, til tider over flere millioner pixels. Hvis hele billedet skulle bestå af så detaljerede overflader ville computeren hurtig bryde sammen. Derfor at det kun det der er forrest i billedet der har høj opløsning. Lidt længere inde i billedet lidt lavere osv. indtil horisonten, hvor de måske kun består af en pixel. Problemet her er, at overgangene fra den ene opløsning til anden bliver meget tydelig, og ofte ses som en direkte overgang(oftest veje og vægge). Filtreringen går ind og udjævner disse overgange så de flyder perfekt sammen. Anisotrofisk filtrering er den mest effektive i dag, og alle producenter bruger den.
NVidia har valgt at bruge adaptiv anisotrofisk filtrering. Det går kort fortalt ud på at man kun filtrere de vigtigste vinkler i billedet. F.eks. gulv, loft og vægge. Til gengæld får man en pæn sjat ekstra ydelse ud af det, og forskellen mellem standard-metoden og denne kan være ret svær at se medmindre man når ud i ekstremer.
Hos nVidia kan man skifte mellem spil-styret, intet, 2x, 4x, 8x og 16x. 16x gange er klart det flotteste, og allerede ved 4x er det faktisk farvel til de fleste grimme texture-overgange.
Pure Video
Nvidia's modstykke til ATi's AVIVO er Pure-video. Pure Video's vigtigste egenskab er at udnytte grafikchippens enorme regnekraft til at give mere virkelighedstro billeder. Siden GeForce3-tiden har man med tiden fundet ud af at man kan udnytte chippens avancerede shader-del til at give os flottere TV/video-billeder på skærmen.
nVIDIA's Pure-video er delt op i tre kategorier:
Ultra-smooth Video skal især henvise til kortets evne til at accelerer det der kaldes HDTV. Altså virkeligt højopløsning af TV, som kan være fra ca. 4gange størrre end DVD op til 16gange alt efter kvalitet. Pure-video kan accelerere følgende formater:H.264, VC-1, WMV, and MPEG-2
At grafikkortet kan afspille filmen, gør at computerens centrale processor bliver aflastet, hvilket gør at man bl.a. vil kunne foretage sig andre tunge ting på maskinen samtidig med at man ser film.
Superb Picture Clarity. Fjerner dobbeltbilleder, giver skarphed og giver ved hjælpe af spatial temporal de-interlacing og inverse telecine som er en form for effektiv antialising, der skal fjerne jaggies. Det fænomen, hvor pixels bliver tydelige og generende.
Precise, vivid colors. Giver perfekt lysstyrke og mulighed for farve-temperaturændringer (Varme / kølige farver) selv op i de højeste native HD-opløsninger som 1920x1080 gennem Component, DVI eller HDMI-stik.
GeForce7900, 7800 og 7600 understøtter alle Pure-video-egenskaber, men der kan læses mere om emnet her hos nvidia.
http://www.nvidia.com/page/purevideo.html
SLi
Flere af nVidia's grafikkort kan fungere i det man kalder SLI, SLI er en egenskab, hvor man sammensætter to eller flere grafikchips kræfter til et billede. SLi kræver dog at man har et bundkort, der understøtter SLI. SLI ses i dag i mindst fire former:
I den mest normale version bruger man to identiske grafikkort (GeForce6600GT eller GeForce7600 eller højere). Disse sættes i et SLi-bundkort med understøttelse for to grafikkort, og forbindes med en SLi-connector.
I den anden version kan man bruge alle GeForce6600-kort og alle GeForce7600 og opefter. Den fungerer på præcis sammen måde som ovenstående. Men her behøver man ikke SLi-connectoren. Nogle GeForcekort især i 6600-serien har ikke mulighed for at få monteret connectoren. Ydelsen falder dog en del, men det kan altså lade sig gøre.
Så er der SLI-modellen, hvor man har to chips på ét grafikkort, f.eks. 7950X2. Her har man stadig brug for at SLI-bundkort, men man behøver kun et stik til grafikkortet. De to chips vil arbejde sammen på samme måde som i den første løsning. Man vil også kunne SLI med to grafikkort med to chips efter den anden løsning. Men her kræves nogle specielle bundkort og oftest de dyreste SLI-bundkort på markedet.
Den sidste og nyeste er Quad-SLi. Her har man brug for et sæt specielle Quad-SLi-grafikkort. Disse grafikkort kan bruges i, hvilket som helst SLI-bundkort, og kombineres på tværs med 2 SLI-connectorer og fire grafikkort på to PCI-E stik.
Brugen af to grafikkort kan udnyttes på flere måder. Oftest vælger spillene selv den mest optimale løsning, men ikke alle spil kan udnytte SLI. Hvis det skal udnyttes kan man vælge 8x eller 16xS-FSAA og de to grafikkort vil kombinere deres FSAA sammen. Ellers læs mere om det i S-FSAA.
Det her GeForce7600GT kan kører med enten den første eller den anden metode i et SLI-ready-bundkort.