Produktet er venligst udlånt af: www.midtdata.dk
Produktet distribueres i DK af: www.leadtek.com
Link til producentens website: www.leadtek.com
Chippens teknologi
Geforce 7800GTX er nVidia's nuværende topmodel, og skulle på mange områder adskille sig væsentligt fra den gamle Geforce6800-chip. NVidia lover op til 24 pixelpipelines, hvilket er 8 mere end de 16 som Geforce6800GT/Ultra har. Til gengæld skulle den kun have 16 ROPs. ROPs beskriver reelt hvor mange pixels pipelinen kan presse igennem, og til trods for 24 pipelines, vil det aldrig være muligt for den at presse mere end 16pixels igennem. Altså præcis det samme som Geforce6800GT/Ultra. NVidia lover til gengæld en kraftig optimeret pipeline, der vil være langt bedre udnyttet end den gamle 6800-chip. Svært at forstå da Geforce6800's pipelines nærmest er perfekte og i ydelse per mhz overgår praktisk taget alt på markedet. Geforce7800GTX ser allerede ud til at minde mere om Geforce6600-chippen end om 6800-chippen.
Faktisk et rigtigt godt sted at tage udgangspunkt i, da geforce6600GT er en chip, der virkelig udnytter sin arkitektur fuldt ud.
| Radeon X850XT-PE | Radeon X800XL | Geforce 6800 | Geforce 6800Ultra | Geforce 7800GTX |
Kodenavn | R480 | R430 | NV41 / NV42 | NV45 | G70 |
Core-frekvens | 540Mhz | 400Mhz | 325Mhz | 425Mhz | 430Mhz |
Pixelpipelines | 16 | 16 | 12 | 16 | 24 |
Ram-DDR-frekvens | 580Mhz | 500Mhz | 300Mhz | 550Mhz | 600Mhz |
Ram-bit-bredde | 256bit | 256bit | 256bit | 256bit | 256bit |
Max Pixelshader | 2.0b | 2.0b | 3.0 | 3.0 | 3.0 |
Max Vertexshader | 2.0 | 2.0 | 3.0 | 3.0 | 3.0 |
Vertex-pipelines | 6 | 6 | 5 | 6 | 8 |
Produktions-teknik | 130nm TSMC | 110nm TSMC | 130nm TSMC, 110nm IBM | 130nm IBM | 110nm TSMC |
Transistorer | ca. 160mio | ca. 160mio | ca. 180mio | ca. 222mio | ca. 302mio |
G70 -chippen
Geforce 7800GTX er som tidligere nævnt baseret på G70-chippen. På nuværende tidspunkt er der kun 7800GTX, men der er rygter om både større og mindre modeller ude på nettet. Bl.a. nævnes der, at der vil komme en Ultra med væsentlig højere frekvenser. At den ikke er her nu, kan skyldes rigtig mange ting. Den ene kan være ren markedsstrategi og at man venter spændt på hvad ATi har i ærmet, så man kan justerer frekvenserne derefter. Noget andet er, at der faktisk ikke findes særlig store mængder af ram, der er hurtigere end 625Mhz, og at man venter på at produktionen på hurtigere ram kommer i gang. En tredje kan være at yields ikke er så gode endnu, at man med vilje har set en "middelmådig" model på markedet og venter med topmodellen. (Gode Yields = en tilfredsstillende procent af fungerende chips ud af den samlede produktion)
Men vi venter selvfølgelig alle spændt på, hvad nVidia ellers smider på markedet, deres pixelpipelines er nemlig meget fleksible og kan deaktiveres af 4stk ad gangen. Det gør det lettere for nVidia at gøre nogle defekte chips brugbare til kort med en lidt dårligere ydelse til følge.
NVidia's chip skulle være meget avanceret, og bygget til at udnytte hver transistor optimalt, opbygningen og udnyttelsen af pipelinen ligner ret meget en gensplejning af det bedste fra Geforce6600GT og 6800-serien
| Pipelines | pixels/p clock | Textures/p clock | Z-pixels/p clock |
ATi R480 | 16 | 16 | 16 | 16 |
nVidia NV45 | 16 | 16 | 16 | 32 |
nVidia NV43 | 8 | 4 | 8 | 8 |
nVidia G70 | 24 | 16 | 24 | 32 |
G70 kan trække op til 24 textures, hvilket især er en fordel for pixelshading (realistiske overflader) 16 pixels eller op til 32Z-pixels som den gamle Geforce6800-serie baseret på NV40/NV45
Så lad os se hvor effektivt at chippen kan udnytte sine pipelines reelt:
Geometri-delen består af hele 8 vertexshaders av VS3.0-typen, hvilket er det højeste vi har set på markedet indtil videre. Frekvensen er dog noget lavere end ATi's X850XT-PE, og den samlede ydelse bør derfor lægge meget tæt, med en marginal fordel til nVidia.
NVidia fortsætter med at bruge den nyeste pixelshader 3.0. Her er der faktisk ikke noget nyt under solen, andet end bedre udnyttelse af chippen. Det skyldes at directX faktisk ikke har ændret ret meget karakter de seneste 3år. Så grafikchip-designerne har ikke noget revolutionerende at putte i chippen. Til gengæld kan de jo give os bedre ydelse. Så bliver spændende om det kan hamle op med ATi's
Jeg har derfor også sat dets Pixelshader-fillrate på en prøve.
Antialiasing og Filtrering
Den tidligere Geforce 6-serie ændrede virkelig på nVIDIA's dårlige FSAA- og anistrofisk filtrerings-ry.
nVIDIA havde ved tidligere generationer af grafikkort brugt nogle efterhånden ret forældede metoder til at gøre dette arbejde og ATi har siden Radeon9700 kom været førende på dette område og ser stadig ud til at være det.
nVIDIA har dog oppede sig gevaldigt med Geforce6-serien, og nu giver de lige det løft der skal til for at komme forbi ATi på det her område også.
Nu tilbyder de også gamma-korrigeret FSAA der indtil nu har været ATi's store fordel i forhold til nVidia.
Det der gør at nVidia nu overtrumfer ATi er pga. transparency Anti-Aliasing. Problemet i dag, hvad angår FSAA, er at vi bruger en mutisample-motode. Vi bruger metoden for at få bedre ydelse, men multisample går reelt ind og abejder med billedet inden der reelt er lagt overflader (textures) på. Det gør at især transparente overflader kommer til at virke grynet og meget pixelleret. En transparent overflade er en overflade man kan kigge igennem. F.eks. et hegn, græs, vinduer og lignende.
Transparency Anti-Aliasing gå simpelthen ind og finder disse transparente overflader og oversampler dem (giver dem en højere opløsning). Nu er det pludseligt muligt at ane at hegnet er tilstede foran én, også på meget lang afstand. Transparency Anti-Aliasing kan både lægges med multisample og supersample. Multisample vil ikke give den store forskel på fine overflader som f.eks. et trådnet, men være perfekt til f.eks. sprossevinduer. Super-sampling går til gengæld helt i dybden, og det er muligt at ane trådnet på meget lang afstand, til gengæld kan det koste meget på ydelsen.
nVIDIA benytter i dag en rotated-sparcegrid-multisample-metode meget lig med ATi's op til 4x. Over 4x bruger nVidia en løsning med supersample og multisample kombineret som dog stadig er lidt gammeldags men giver en god skarp billedkvalitet. Derudover har der blevet tilføjet 16xFSAA i Sli der består af 4x Supersample der hver især har 4xMultisample.
Til anisotrofisk filtrering benyttes der en adaptiv løsning li' den de har brugt med Geforce6-serien. Den adaptive metode filtrerer de områder der er mest synlige, og kan derved booste ydelsen i en positiv retning uden at det går direkte ud over billedkvaliteten. Personligt er jeg fortaler for den adaptive løsning da det giver bedre ydelse, hvor den ikke-adaptive kan være forholdsvis tung at danse med.