Teknologi
Denne sektion af artiklen er skrevet af Klavs S. ATI har valgt en ganske radikal tilgang til X1000-serien. Alle VPU'er produceres hos TSMC og benytter deres 90nm teknologi. Rygterne siger dog allerede nu at UMC også skal til at producere for ATI - blandt andet fordi yields indtil videre ikke har været imponerende hos TSMC.
En lille detalje er dog at de tre nye VPU'ers kodenavne - RV515, R520 og R530 - i ordren hos UMC skulle stå opført som RV516, R521 og R531. Det kan betyde at der er tale om et re-design, hvilket falder lidt i tråd med at ATI havde store problemer med at R520 VPU'en til at virke. Først da den blev "taped out" tredje gang var ATI's ingeniører tilfredse. UMC skulle begynde produktionen af ATI-chips ved udgangen af indeværende år.
Tilbage til den nye serie, hvor alle produkter - også X1300-serien - har fuld Shader Model 3.0 support. Shader Model 3.0 er ikke en kæmpe revolution over 2.0b, men enkelte ting er værd at bide mærke i. Dels har man et meget større head-room i antal af instruktioner og man har support for eksempelvis two-sided lightning og vertex teksturer.
FP32 floating point beregninger understøttes også igennem hele serien og det samme gør en forbedret anisotropisk filtrering. AVIVO introduceres også med X1000-serien, men det kommer vi tilbage til.
Arkitekturen på den nye generation er nemlig værd at se nærmere på. ATI har introduceret en ny "Ring Bus" hukommelsesarkitektur, der går igen over hele linjen. Den understøtter desuden GDDR4 standarden, når der engang er produkter klar.
Selve Ring Bus konceptet er helt nyt og et opgør med den almindeligt kendte point-to-point arkitektur. Indtil videre har man (med en 256-bit bred bus) skulle lægge 256 fysiske traces (printbaner) fra VPU'en til grafikkortets RAM. Dette er naturligvis ikke helt nemt og i takt med at VPU'er bliver mindre og mindre (forbedret produktionsteknologi) har man måttet tilføje flere og flere lag til grafikkortets print for at klare alle de fysiske printbaner. Da printets pris ofte afgøres af hvor mange lag, det består af har en 512-bit bus ikke været en oplagt løsning - enhver designer af grafikkort måtte svede bare ved tanken om at skulle fordoble antallet af printbaner.
ATI har nu fundet en anden løsning, hvor man via en ring-arkitektur har fire "stationer" rundt om VPU'ens memory-controller. Hver station har 2 32-bit forbindelser til memory-controlleren og 2 udgående 256-bit forbindelser til de to omkringliggende stationer. ATI kalder dette for en 512-bit arkitektur på baggrund af at man har 2 256-bit ringe rundt om memory-controlleren.
Ét problem i denne arkitektur kan være en forhøjet latency, men ATI mener selv at have løst dette. Hver station rundt i ringen har sin egen cache og den cache er (som ATI kalder det) "fully associative", hvilket betyder at data kan skrives vilkårligt til og fra cache'en. Tidligere var cache'ens data-struktur "direct mapped", hvilket betød at data 1 skulle tages fra cache 1, data 2 fra cache 2, osv. Med den nye arkitektur kan data 1 hentes hvor i cache'en den nu ligger placeret, hvilket kraftigt forbedrer cache-ydelsen. ATI siger selv at man skal regne med 5 - 30% forbedret cache-ydelse i X1800 set i forhold til X850.
ATI har valgt nogenlunde samme arkitektur i de tre nye chips. Først og fremmest har man ladet hver shader-enhed få betegnelsen Shader Processor. Selve data-strømmen er også ændret således at man udnytter VPU'en maksimalt.
Data kommer først til én af de otte (for R520 VPU'en) Vertex Shader processorer. Herfra sendes den til ATI's nyudviklede "Ultra-Threading Dispatch Processor", der opdeler data i 512 "threads". Dette sker netop for fuldt at udnytte den nye 512-bit Ring Bus.
Herfra sendes data til én af de fire (igen for R520 VPU'en) Pixel Shader cores. ATI kalder disse for Quad Pixel Shader cores, men teknisk set er det ikke meget anderledes end på R4xx VPU'erne. Man samler blot fire Pixel Shader processorer og har som noget nyt givet hver Pixel Shader processor en Branch Execution Unit, der vil hjælpe til at aflaste resten af VPU'en ALU'er.
Generelt har ATI's mål med den nye arkitektur været at sørge for at alt i VPU'en har instruktioner at arbejde med. Det har været vigtigt at minimere idle-tiden internt og få maksimal ydelse hele tiden.
Indtil videre ser idéen bag ganske fornuftig ud og det er en god grundidé. Ydermere er selve arkitekturen i høj grad modul-baseret, hvilket gør designet nemmere at arbejde med. Både med hensyn til afarter af eksisterende produkter, men også med hensyn til fremtidige løsninger, hvor ATI kan optimere hvert modul for sig.
Når man ser opbygningen af X1800, X1600 og X1300, ser man tydeligt den omtalte modulare struktur.
Et kig i tabellen over de tre nye produkter viser også fordelene ved denne opbygning - man benytter samme arkitektur, hvilket gør det nemmere for software-udviklere at skrive kode, der kan afvikles på samme måde i alle tre VPU'er. Ikke med samme hastighed, naturligvis, men der behøves ikke specifik hensyntagen til hver enkelt VPU-design.
--------------------------------------------------------------------------------------------------
Avivo ATI har med X1000-serien forsøgt at gøre VIVO (Video-In, Video-Out) til et afgørende salgsparameter og det forstår man så udmærket, når man tænker på ATI's overlegenhed på dette område. NVIDIA er med deres PureVideo kommet godt efter det, men historisk set har ATI altid været foran her.
AVIVO kommer uden tvivl på markedet nu, for at lægge sig op af Intel's Viiv-standard, der bliver en slags Centrino-standard til Media Center PC'er. Men hvad er det så at AVIVO kan?
AVIVO er først og fremmest en forbedring i forhold til Video-grabbing. Meget af teknologien kommer fra ATI's Rage Theater 550 chip og det er heller ikke et dumt sted at starte. AVIVO byder på eksempelvis 12-bit analog-til-digital converter og en hardware-styret de-noise funktion til at formindske kvalitetstabet ved grabbing af video.
Næste store trin er ved kodning og om-kodning af video. Kodning (eller encoding om man vil) vil ske udelukkende i hardware, men mere interessant er det at om-kodning (til eksempelvis et andet størrelsesformat end det oprindelige) nu kan ske med assistance fra VPU'en. Især for den kommende H.264 standard bliver dette vigtigt, fordi H.264 er meget tungt - til gengæld leverer det fantastisk billedkvalitet.
Hele X1000-serien understøtter dette, men udover H.264 er der også VPU-assisteret support for formater som WMP9, WMV9 PMC, MPEG 2, MPEG 4, VC-1 og DivX.
De-kodning af disse formater (undtagen WMV9 PMC og DivX) kan også ske assisteret af VPU'en i AVIVO. Især ved H.264 er dette en fordel på grund af det tunge fil-format - omkring en 50% reduktion af CPU-tid kan brugerne forvente, lover ATI.
Endelig giver AVIVO større båndbredde til DVI-udgangen og således vil det ikke længere være nødvendigt at bruge to udgange for at styre eksempelvis Apple's 30" Cinema LCD-skærm - det kan enkelt DVI-udgang fra AVIVO nu klare. Så er det jo bare på med fire af disse skærme til Crossfire setup'et.
--------------------------------------------------------------------------------
FSAA Resten af denne sektion er skrevet af Red_martians ATi har flere spændende former for FSAA især med CrossFire. Det ATi grundlæggende bygger deres FSAA på er det der hedder Sparse-grid Multisample. For at gøre det simpelt, er det en af de flotteste former for FSAA, og både nVidia og ATi bruger den form for antialiasing for kortet FSAA (Full Scene AntiAliasing).
Derudover har ATi følgende udvidelser derpå:
AAA
HDR+FSAA
TAA
S-FSAA (CrossFire-egenskab)
AAA(Adaptiv AntiAliasing) er faktisk samme system som nVidia's TSAA og TMAA (Transperant Super/Multi-Sample AntiAliasing) Ideen er meget simpelt at fjerne en af de sidste rester af multisamples svagheder. Nemlig at de ikke kan antialiasere textures. Dette gør at transperente overflader som vinduer, hegn, gitter osv. ikke får sin portion af FSAA. Det laver AAA om på. AAA kan sættes til kvalitet og ydelse. Kvalitet giver klart det flotteste resultat, og den meget lille ydelsesnedgang gør at man under alle omstændigheder burde bruge det.
HDR+FSAA er ATi ifølge dem selv de eneste der kan præstere på nuværende tidspunkt. HDR er en shader 3.0-effekt, der giver langt mere realistiske lysindfald og mere ægte skygger. HDR er ret tungt, og man skal ikke regne med at kunne køre det sammen med FSAA med low-end-kort og sjældent med midrange. Det er især en egenskab lavet til de hurtigste modeller til de tungeste spil.
TAA (Temporal AntiAliasing) er faktisk ganske smart, men kræver at spillet har en høj framerate. Altså et kraftigt grafikkort er anbefalet. Idéen er kort at FSAA skifter metode ved hvert andet billede. Første billede bruger metode 1, andet billede metode 2, tredje billede metode 1 igen. osv. Dvs. at hvis billedet kører med 60fps (som er min.) vil FSAA kun arbejde med 2 gange 30fps. Og går det for langsomt, vil kanterne begyndte at blinke hvilket er ret irriterende for øjnene.
S-FSAA (Super Full Scene AntiAliasing) kan kun lade sig gøre med 2grafikkort i Crossfire. Teknikken handler kort om at hver grafikkort laver hver sin pixel med FSAA og blender dem sammen, altså meget hen af TAA, men istedet for hvert andet, bliver de her blændet sammen. Resultatet er rigtig flot, men igen, ATi er ikke de eneste, da nVidia også har dette til deres grafikkort. Men idéen er især smart til spil der er CPU-begrænsede, og man derfor stadig kan udnytte sit CrossFire-setup. Men det kræver CrossFire i modsætning til det andet.
--------------------------------------------------------------------------------
Filtrering Anistrofisk Filtrering er næsten uundværligt idag. Har man prøvet det, går man aldrig væk fra det igen. ATi går faktisk et skridt tilbage med X1000-serien da de nu tilbyder den gamle form for anisotrofisk filertrering. Men det er ikke ensbetydende med at det er skidt. Den gamle er langt mere effektiv, og med vores moderne og hurtige grafikkort er der nok ikke så meget ydelse at miste som tidligere.
ATi kalder det "kvalitet og ydelse" (Quality and Performance). Ydelse er den metode man tidligere brugte, den er hurtig og filtrerer de mest synlige steder ligeså effektivt som kvalitets-metoden, og kvalitet er den helt gamle men flottere metode, der filtrerer hele billedet lige effektivt. Det er nu muligt selv at vælge mellem dem
--------------------------------------------------------------------------------
CrossFire Alle moderne Ati-grafikkort kan fungere I CrossFire. CrossFire-support betyder kort fortalt, at man kan sætte to eller flere grafikkort i maskinen og får dem til at arbejde sammen, og derved give op til teoretisk dobbelt ydelse. Teoretisk er vigtigt at påpege da det praktisk kun kan lade sig gøre i helt specielle situationer og at den reelle ydelsesfremgang ved to ligger på 0-70% alt efter spil, grafikkort, tidspunkt osv.
I dag findes der tre former for Crossfire-opsætning.
Den første kendte version var den der blev benyttet til X800-serien. Her blev et DVI-kabel fra et normalt grafikkort forbundet til et specielt CrossFire-grafikkort (også kaldet mastercard) CrossFire-kortet har to funktioner. Den ene er at fungere som det andet grafikkort, den anden er at sammensætte billederne fra dem begge. Derfor har CrossFire-kortet en speciel chip til dette (kaldet composition-engine)
Den første Version har ATi så udviklet videre på. Den gamle udgave til X800 led af nogle børnesygdomme som max 60hz på skærmen i spil, og et den ene CrossFirefunktion (Den tidligere nævnte S-FSAA) ikke kunne gå gennem kabelet, men i stedet skulle igennem PCI-express-slottet så til bundkortchipsne og tilbage til det andet grafikkort. Samtidig blev der udviklet et mere massivt kabel til overførslen. Dette system bruger X1800 og X1900-kortene.
Den tredje udgave er den mest simple men også langsomste løsning. Her bliver to identiske almindelige grafikkort sat i et CrossFire-bundkort og så sørger softwaren for resten. Signalerne passerer igennem bundkortet fra det ene til det andet grafikkort, og pga. at disse ressourcer er temmelig pressede i forvejen, falder ydelsen en del. Dette er set som en løsning til X1300 og X1600-serien.
Crossfire kan rendere billedet på flere forskellige måder. Det er sjældent noget man selv kan vælge, og kan det vælges, skal det gøres i selve spillet. Der er dog en egenskab man kan bestemme 100% det er enmlig S-FSAA-ydelsen som er nævnt under FSAA. Når 2 grafikkort er sat til CrossFire vil der i FSAA-egenskaber også stå 8-10-12 og 14x FSAA. Sætter man grafikkortet på det, aktivere man en CrossFire-renderings-metode i form af S-FSAA, men deaktiverer til gengæld en af de normale..
Vil man vide mere om de egenskaber kan det læses her:
http://www.hardware-test.dk/ht/test_show.asp?id=3999