Korrekturlæser: 
Billed behandling: 
Oversættelse: 

Pristjek på http://www.pricerunner.dk 
Produkt udlånt af: Sd-Data A/S
DK distributør: Sd-Data A/S
Produktet er venligst udlånt af: http://www.MSI.com.tw
Produktet distribueres i DK af: http://www.InterData.dk
Link til producentens website: http://www.MSI.com.tw

Teknologier:



Først kom CineFX, dernæst CineFX 2.0 og nu bringer NVidia os sammen med Geforce 6800 CineFX 3.0.
CineFX er NVidias navn for en række teknologier og features, der sørger for, at man kan nyde naturtro grafik med bedst mulig ydelse.

Den største nyhed i CineFX 3.0 er Shader Model 3.0 (herunder Pixel Shader 3.0 og Vertex Shader 3.0), der nu lever op til DirectX 9.0c specifikationer, mens der af andre nye teknologier, kan nævnes en integreret video processor og IntelliSample 3.0.


Integreret video processor:


Med Geforce 6800 serien har NVidia tilføjet en dedikeret video encoding/decoding processor, som sørger for at aflaste CPU'en betydeligt, når der afspilles eller encodes film.

Hardwareaccelereret videoafspilning er set før, men aldrig lige så effektivt, som på et Geforce 6800. ForceWare driverne er dog endnu ikke optimeret til dette, da der i første omgang er fokuseret på spil ydelse, men når nyere ForceWare versioner bliver udviklet, vil dette sikkert være ændret.

Hvor stor betydning video processoren har, er ikke til at sige endnu, men under MPEG-2 afspilning, skulle video processoren overtage hele 95% af arbejdet og mere end 60% ved MPEG-2 encoding.

Med nyere ForceWare kommer der muligvis også understøttelser for andre video formater, men indtil videre er kun WMV, MPEG-2 og MPEG-4 understøttet.


Intellisample 3.0:


Teknologierne, der går ind under navnet IntelliSample, bruges til at forbedre billedkvaliteten og hvor IntelliSample 2.0 bragte bedre ydelse, bringer IntelliSample 3.0 bedre billedkvalitet. En af de nye ting er forbedret Anti-Aliasing, hvor NVidia tidligere har været ATi underlegen.

Et skærmbillede er opbygget af bittesmå pixels, som er placeret i ud for hinanden i vandrette og lodrette rækker og hver pixel kan kun have én farve. Det giver problemer når der skal "tegnes" skrå linier og ubehagelige hak og kanter opstår (se det første billede, hver tern repræsenterer en pixel). Anti-Anliasing modvirker dette ved at ændre en lille smule på de omkringliggende pixels farver - egentlig ser det ikke særligt pænt ud, men det er kun fordi, der er zoomet ind på billedet. I praksis er pixels så små, at øjet snydes og den skrå linie fremstår skrå og uden hak.

Når Anti-Aliasing skal bestemme farven på en pixel, udtages der fra hver pixel, afhængig af kvalitetsgraden, et antal subpixels hvis farver sammenlignes og på baggrund af dette beregnes farven, som hver pixel skal have. En subpixel er en mindre del af en pixel.

Grunden til at ATi's overlegenhed på dette punkt, skal findes i, at ATi har brugt "Rotated Grid Anti-Aliasing", hvor subpixels udtages, så de ikke ligger på linie, mens NVidia har brugt en metode, hvor de udtagne subpixels ligger på linie.

Det betyder, at ved linier der er næste vandrette/lodrette kan subpixels ikke udtages på en sådan måde, at den skrå linie kan "glattes" korrekt ud. Det er selvfølgelig afhjulpet i Geforce 6800, der nu også benytter Rotated Grid Anti-Aliasing.


Shader Model 3.0:
Umiddelbart ville man tro, at shaders "bare" ligger skygger på diverse overflader, men det er meget mere komplekst end som så. Teksturer vil altid være kedelige overflader, der er statiske og uden nogen form for effekter, men her kommer shaders ind i billedet.

Shaders kan manipulere overfladerne, lave specielle effekter og selvfølgelig skyggeeffekter - effekter der alle tjener formålet at gøre grafikken så naturtro som muligt.

En shader effekter kunne f.eks. være en overflade, der bevæger sig og reflektere lys eller sagt på godt dansk: Vand!
En anden kunne være det der på engelsk kaldes "radiosity". Forestil dig et rum oplyst af solskin fra et vindue. Placeres et stort stykke orange karton i solstrålen vil farverne i rummet ændre sig i retning af orange nuancer pga. den "farvefangende" effekt lys har - det er radiosity.

Disse er begge effekter, der allerede eksisterede i Shader Model 2.0. Af nye effekter kan nævnes displacement mapping, soft shadows, subsurface scattering og High Dynamic Range rendering.



Soft shadows, eller bløde skygger, er en ting som vi ser hele tiden i hverdagen, men i spil har vi været vant til hårde skygger, hvor kanterne har ikke nogen glidende overgang til overfladen uden skygge. Et problem med de hårde skygger er også, at Anti-Aliasing ikke virker med disse. På billedet kan man se eksempler på både bløde og hårde skygger.



Subsurface scattering giver muligheden for at lave halvgennemsigtige overflader, det kan f.eks. bruges når der skal renderes hud, så man kan se blodårer under hudens overflade.



High Dynamic Range rendering er en forbedring af den effekt stærkt lys har; lyset er blevet "blødt" at se på og objekter, der bliver oplyst af lyskilden, har et mere rigtig "glow". Teknisk set er det blot antallet af brightness værdier der øges, deraf navnet som groft oversat betyder "Højt Dynamisk Område". Det betyder at overgange mellem lys og mørk har flere nuancer og derved kan gøres mere flydende.
High Dynamic Range er i brug på billedet til højre, hvis nogen skulle være i tvivl.



Virtual Displacement mapping er nok den effekt i Shader Model 3.0, der bringer mest "eye candy". Virtual displacement mapping skal erstatter bump mapping, der simulerer dybde i overflader. Overflader der egentlig er helt flade (på computeren selvfølgelig), f.eks. små ujævnheder i en væg eller ovennævnte vandeffekt.

Problemet er dog at dybden som sagt kun simuleres - ser man på overflade fra siden vil denne stadig være helt flad og derfor er bump mapping bedst på afstand.

Virtual Displacement mapping giver mulighed for at manipulere overfladen, så denne rent faktisk bevæger sig, som var det et polygon. Lys og skygge effekter følger selvfølgelig med og Anti-Aliasing virker også korrekt på skygger skabt af virtual displacement mapping.



Light Shaft Rendering er en teknik, der gør det muligt at kreere en effekt, der hidtil har været meget svær at lave på effektiv vis. Vi ser tit effekten i film og selvfølgelig også i virkeligheden, når lys bliver reflekteret af bittesmå partikler i luften, f.eks. tåge, røg eller støv. Med nye volumetric rendering teknikker og Light Shaft Rendering kan der kreeres meget overbevisende repræsentationer af denne effekt.

På den lidt mere tekniske front har både pixel og vertex shader programmer fået øget deres længde fra henholdsvis 96 og 256 instruktioner til intet mindre end 65535 instruktioner. På selve grafikkortet er grænsen helt fjernet, så de 65535 skyldes begrænsninger i operativsystemet/DirectX.

Dynamic branching er også kommet til - en funktion der sørger for at unødvendig grafik og instruktioner ikke bliver behandlet, f.eks. grafik, der ikke kan ses pga. et objekt står foran det.

Af andet godt kan nævnes instancing, der bl.a. bruges når scener med mange ens objekter skal renderes, f.eks. soldater i krig. I stedet for at programmøren skal skrive en instruktioner til hver eneste soldat, kan programmørerne nøjes med at skrive én instruktion og så kan denne genbruges til hver soldat.

Derudover er der en række forbedringer indenfor selve afviklingen af instruktionen og håndteringen af lagerforbrug.

Generelt kan der siges, at Shader Model 3.0 bringer mest godt til programmørerne og frameraten i form af hendholdsvis mindre arbejde og flere FPS. På billedfronten bliver displacement mapping nok bliver den største synlige effekt.





SLI teknologien



Nedenstående er venligst sammenfattet af Red_Martians.

Multigrafikchip-rendering:
En chip giver god ydelse, men giver 2 chips så dobbelt ydelse? I så fald ville det være en måde både at spare penge på og få nogle meget hurtige grafikkort. Denne idé lever snart alle grafik-chip-producenter meget højt på og kan det lade sig gøre, vil det virkelig bære frugt. Problemet er bare at løsningen ikke er så enkelt igen. Oftest skal f.eks. 2 chips have hver deres RAM-lager. Det betyder, at RAM-mængden ikke er fælles, men delt op i to dele. 512MB på et grafikkort med 2 chips eller 2 grafikkort er reelt 2x256MB, hvor den teoretiske brugbare mængde kun er 256MB. Båndbredden er til gengæld den dobbelte.
Et andet problem er at de 2 chips skal arbejde sammen og det er meget svært at udnytte det fulde potentiale af 2 chips. Det svare lidt til at have 2 motorer til at trække en bil og regne med at få dobbelte antal hestekræfter ud af det.

SLI:
nVIDIA har aldrig arbejdet særligt meget med flere chips på et grafikkort, men med overtagelsen af 3dfx fik de virkelig nogle dygtige folk ind fra dette område. 3dfx var netop kendt for deres SLI-løsning også kendt som Scan-Line-Interleaving. Metoden var simpel men ikke særlig effektiv da man bad hver chip om at tegne hver anden linie i en given opløsning. De enkelte chips blev nødt til at have næsten de samme oplysninger på deres ram, til gengæld arbejdede de enkelte chips meget effektivt indbyrdes og metoden var så simpel, at den kunne bruges i alle spil uden patches eller specialskrivning af spilkoden. Oprindeligt arbejdede disse løsninger sammen analogt, men i deres sidste modeller blev metoden digitaliseret og finpudset til højere hastigheder.

Ved overtagelsen af 3dfx sikrede nVIDIA sig nogle rigtig gode folk inde for dette område og arbejdede derefter videre på idéen med flere chips i samarbejde. nVIDIA brugte oven i købet den samme forkortelse stående for Scaleable-Link-Interface også kendt som SLI.
Forskellene fra det gamle 3dfx er dog fuldstændige og det eneste sammenlignelige er flere samarbejdende chips og forkortelsen for navnet. Metoden eller rettere metoderne har dog intet med det gamle 3dfx-navn at gøre.


Renderings-navnMetodeProducent
SLI (Scan-Line-Interleaving)Hver anden linie3dfx Voodoo2 og 5
AFR (Alternate-Frame-Rendering)Hvert andet billedeATi Maxx
NVIDIA 6-series
XGI Volari Duo*
SFR (Split Frame Rendering)2 variable skærmhalvdeleNVIDIA 6-series
AMR (ATi Multi Rendering)Tiled-baseret. Små firkatner af
skærmbilledet deles skiftehvis
mellem de enkelte chips
ATi R5xx-series

* Metoden er reelt den samme bare kaldet Bit-Fluent.

nVIDIA benytter sig altså af 2 teknikker kaldet AFR og SFR. Problemet med nVIDIAs metode er at spillet skal skrives direkte til netop en af metoderne for at fungere optimalt. Hvis ikke det bliver gjort og driveren ikke er parat til det vil de enkelte chips ikke samarbejde og man vil kun opnå ydelse som en single-chip-løsning.



AFR lader 2 grafikchips arbejde således, at de skiftevis arbejder med hver deres billede. Billed1 = chip1, Billed2 = Chip2, Billed3 = Chip1 osv.
Løsningen er meget simpel, og lader de enkelte chips arbejde forholdsvis uafhængigt af hinanden. De billeder de laver strømmer bare igennem som en højere framerate, men de kræver meget af rammene ligesom den gamle 3dfx-SLI-teknik.

SFR lader de enkelte chips arbejde mellem 2 halvdele af billedet. Øverste del tager chip1 sig af og nederste tager chip2 sig af. Når en af de enkelte chips får mere en 50% af arbejdet (selve den komplekse del af geomtriopbygning, shaderberegning osv.) flytter den arbejdet mellem sig ved at give mere end 50% af skærmbilledet til den mindst belastede chip.
Denne løsning er meget effektiv, men kræver et imponerende samarbejde mellem chipsne.

For at bruge nVIDIA-SLI kræver det i de fleste tilfælde et specielt bundkort, der er godkendt til SLI.
På nuværende tidpunkt er der:
  • nVIDIA nForce4-SLI.

  • nVIDIA nForce4-IE.

  • nVidia nForce4Pro.

  • Intel Tumwater.


  • I 2 af tilfældene med de almindelige nForce4 bundkort skal der bruges løse PCI-E lanes. Det betyder at man skal have mulighed for at flytte rundt med sine lanes til grafikkortet.
    Lanes beskriver hvor mange veje der går til et PCI-E stik. Der går f.eks. 16 lanes til et PCI-e x16 slot, 4 lanes til et x4 PCI-E slot osv.
    Et nForce4 har kun 20 lanes i alt og da 16 af dem går til grafikslottet har man ikke nok til 2x16 (32lanes i alt) til 2 grafikkort. Derfor fjerner man 8 lanes ved det ene grafikslot og tilfører til det andet.



    Billedet beviser også hvorfor det er muligt at køre SLI med et enkelt grafikkort som Gigabytes Dual6600GT. På sådan et grafikkort bruger chip 1 de første 8 lanes og chip 2 de sidste 8.
    Fidusen er at man bare indstiller SLI-opsætningen til single grafikkort og så detektere bundkortet det som om der sidder 2 grafikkort i maskinen, selvom det kun er et med 2 chips.
    Dette system forsvinder muligvis meget snart, da over 32 lanes på bundkort er inde for rækkevidde inden for det næste års tid.