Test: Sapphire Radeon X1800XL

Grafikkort, AMD/ATI d.  18. november. 2005, skrevet af Illuminati 4 Kommentarer.  Vist: 6678 gange.

Korrekturlæser: 
Billed behandling: 
Oversættelse: 

Pristjek på http://www.pricerunner.dk 
Produkt udlånt af: Sd-Data A/S
DK distributør: Sd-Data A/S
Produktet er venligst udlånt af: http://www.sapphiretech.com
Produktet distribueres i DK af: http://www.rosenmeier.dk
Link til producentens website: http://www.sapphiretech.com

Teknologi & arkitektur


Denne sektion af artiklen er skrevet af Klavs S.


ATI har valgt en ganske radikal tilgang til X1000-serien. Alle VPU'er produceres hos TSMC og benytter deres 90nm teknologi. Rygterne siger dog allerede nu at UMC også skal til at producere for ATI - blandt andet fordi yields indtil videre ikke har været imponerende hos TSMC.

En lille detalje er dog at de tre nye VPU'ers kodenavne - RV515, R520 og R530 - i ordren hos UMC skulle stå opført som RV516, R521 og R531. Det kan betyde at der er tale om et re-design, hvilket falder lidt i tråd med at ATI havde store problemer med at R520 VPU'en til at virke. Først da den blev "taped out" tredje gang var ATI's ingeniører tilfredse. UMC skulle begynde produktionen af ATI-chips ved udgangen af indeværende år.

Tilbage til den nye serie, hvor alle produkter - også X1300-serien - har fuld Shader Model 3.0 support. Shader Model 3.0 er ikke en kæmpe revolution over 2.0b, men enkelte ting er værd at bide mærke i. Dels har man et meget større head-room i antal af instruktioner og man har support for eksempelvis two-sided lightning og vertex teksturer.

FP32 floating point beregninger understøttes også igennem hele serien og det samme gør en forbedret anisotropisk filtrering. AVIVO introduceres også med X1000-serien, men det kommer vi tilbage til.

Arkitekturen på den nye generation er nemlig værd at se nærmere på. ATI har introduceret en ny "Ring Bus" hukommelsesarkitektur, der går igen over hele linjen. Den understøtter desuden GDDR4 standarden, når der engang er produkter klar.

Selve Ring Bus konceptet er helt nyt og et opgør med den almindeligt kendte point-to-point arkitektur. Indtil videre har man (med en 256-bit bred bus) skulle lægge 256 fysiske traces (printbaner) fra VPU'en til grafikkortets RAM. Dette er naturligvis ikke helt nemt og i takt med at VPU'er bliver mindre og mindre (forbedret produktionsteknologi) har man måttet tilføje flere og flere lag til grafikkortets print for at klare alle de fysiske printbaner. Da printets pris ofte afgøres af hvor mange lag, det består af har en 512-bit bus ikke været en oplagt løsning - enhver designer af grafikkort måtte svede bare ved tanken om at skulle fordoble antallet af printbaner.

ATI har nu fundet en anden løsning, hvor man via en ring-arkitektur har fire "stationer" rundt om VPU'ens memory-controller. Hver station har 2 32-bit forbindelser til memory-controlleren og 2 udgående 256-bit forbindelser til de to omkringliggende stationer. ATI kalder dette for en 512-bit arkitektur på baggrund af at man har 2 256-bit ringe rundt om memory-controlleren.

Ét problem i denne arkitektur kan være en forhøjet latency, men ATI mener selv at have løst dette. Hver station rundt i ringen har sin egen cache og den cache er (som ATI kalder det) "fully associative", hvilket betyder at data kan skrives vilkårligt til og fra cache'en. Tidligere var cache'ens data-struktur "direct mapped", hvilket betød at data 1 skulle tages fra cache 1, data 2 fra cache 2, osv. Med den nye arkitektur kan data 1 hentes hvor i cache'en den nu ligger placeret, hvilket kraftigt forbedrer cache-ydelsen. ATI siger selv at man skal regne med 5 - 30% forbedret cache-ydelse i X1800 set i forhold til X850.

ATI har valgt nogenlunde samme arkitektur i de tre nye chips. Først og fremmest har man ladet hver shader-enhed få betegnelsen Shader Processor. Selve data-strømmen er også ændret således at man udnytter VPU'en maksimalt.



Data kommer først til én af de otte (for R520 VPU'en) Vertex Shader processorer. Herfra sendes den til ATI's nyudviklede "Ultra-Threading Dispatch Processor", der opdeler data i 512 "threads". Dette sker netop for fuldt at udnytte den nye 512-bit Ring Bus.

Herfra sendes data til én af de fire (igen for R520 VPU'en) Pixel Shader cores. ATI kalder disse for Quad Pixel Shader cores, men teknisk set er det ikke meget anderledes end på R4xx VPU'erne. Man samler blot fire Pixel Shader processorer og har som noget nyt givet hver Pixel Shader processor en Branch Execution Unit, der vil hjælpe til at aflaste resten af VPU'en ALU'er.

Generelt har ATI's mål med den nye arkitektur været at sørge for at alt i VPU'en har instruktioner at arbejde med. Det har været vigtigt at minimere idle-tiden internt og få maksimal ydelse hele tiden.

Indtil videre ser idéen bag ganske fornuftig ud og det er en god grundidé. Ydermere er selve arkitekturen i høj grad modul-baseret, hvilket gør designet nemmere at arbejde med. Både med hensyn til afarter af eksisterende produkter, men også med hensyn til fremtidige løsninger, hvor ATI kan optimere hvert modul for sig.

Når man ser opbygningen af X1800, X1600 og X1300, ser man tydeligt den omtalte modulare struktur.



Et kig i tabellen over de tre nye produkter viser også fordelene ved denne opbygning - man benytter samme arkitektur, hvilket gør det nemmere for software-udviklere at skrive kode, der kan afvikles på samme måde i alle tre VPU'er. Ikke med samme hastighed, naturligvis, men der behøves ikke specifik hensyntagen til hver enkelt VPU-design.



X1800-serien - R520





R520 er ATI's hurtigste VPU nogensinde og den alene kan afgøre en stor del af succes'en for X1000-generationen. Det har nemlig vist sig at hvis man har forbrugernes loyalitet i high-end, så forplanter det sig ned i resten af segmenterne, hvor forbrugerne oftest lægger deres spareskillinger. Hvis eksempelvis X1800 XT er hurtigere end NVIDIA's GeForce 7800GTX, så vil mange forbrugere vælge Radeon X1600 frem for GeForce 6600 - uanfægtet af at GeForce 6600 yder bedre, er billigere, eller hvad man nu ville kunne opleve. Loyaliteten henter man altså i high-end.

ATI har bevidst gået efter dette og da man i sin tid introducerede R300 VPU'en - Radeon 9700 Pro - havde man et klart mantra; "Capture The Flag!". Man ville simpelthen overtage føringen med markedets bedste produkt og dermed vinde forbrugernes loyalitet. En strategi, som lykkedes til fulde og i lang tid sendte NVIDIA i tovene - selvom ATI's udbud af løsninger slet ikke stod mål med NVIDIA's massive produktportefølge.

Men hvad består X1800-serien så af? Svaret er (indtil videre) to forskellige muligheder:

Radeon X1800 XL:
  • 500MHz VPU
  • 1GHz RAM
  • 256MB GDDR3 RAM

    Radeon X1800 XT:
  • 625MHz VPU
  • 1.5GHz RAM
  • 256MB eller 512MB GDDR3 RAM

    Radeon X1800 XL bliver en slags entry-level løsning (hvis man kan kalde det sådan i high-end), der sigter direkte mod NVIDIA's GeForce 7800GT, hvorimod X1800 XT skal konkurrere mod GeForce 7800GTX, der er lige på trapperne i en 512MB udgave.

    Man lægger også mærke til at der er knap så megen konsistens i ATI's valg af suffix'er. XL, Pro og XT er gennemgående, men hvis ATI fortsætter deres terminologi skal Pro ligge imellem XL og XT. Det må betyde at der er plads til endnu et kort imellem X1800 XL og XT samt at ATI muligvis kan have en low-end part i X1600-serien på bedding.

    Strømforbruget på X1800-serien er til gengæld ikke noget ATI praler voldsomt af. I hvert fald skal X1800-ejere overveje om deres strømforsyning kan klare de mange watt kortet trækker. ATI har intet officielt på banen med strømforbruget, men tests viser at X1800 XT ligger omkring 105 - 115W under load, hvilket absolut er i den høje ende. Pudsigt er det at X1800 XL ligger på omkring 60W - altså næsten det halve - hvilket tyder på at VPU'en oplever et massivt strømlæk ved høje clockfrekvenser.



    Avivo



    ATI har med X1000-serien forsøgt at gøre VIVO (Video-In, Video-Out) til et afgørende salgsparameter og det forstår man så udmærket, når man tænker på ATI's overlegenhed på dette område. NVIDIA er med deres PureVideo kommet godt efter det, men historisk set har ATI altid været foran her.

    AVIVO kommer uden tvivl på markedet nu, for at lægge sig op af Intel's Viiv-standard, der bliver en slags Centrino-standard til Media Center PC'er. Men hvad er det så at AVIVO kan?

    AVIVO er først og fremmest en forbedring i forhold til Video-grabbing. Meget af teknologien kommer fra ATI's Rage Theater 550 chip og det er heller ikke et dumt sted at starte. AVIVO byder på eksempelvis 12-bit analog-til-digital converter og en hardware-styret de-noise funktion til at formindske kvalitetstabet ved grabbing af video.

    Næste store trin er ved kodning og om-kodning af video. Kodning (eller encoding om man vil) vil ske udelukkende i hardware, men mere interessant er det at om-kodning (til eksempelvis et andet størrelsesformat end det oprindelige) nu kan ske med assistance fra VPU'en. Især for den kommende H.264 standard bliver dette vigtigt, fordi H.264 er meget tungt - til gengæld leverer det fantastisk billedkvalitet.

    Hele X1000-serien understøtter dette, men udover H.264 er der også VPU-assisteret support for formater som WMP9, WMV9 PMC, MPEG 2, MPEG 4, VC-1 og DivX.

    De-kodning af disse formater (undtagen WMV9 PMC og DivX) kan også ske assisteret af VPU'en i AVIVO. Især ved H.264 er dette en fordel på grund af det tunge fil-format - omkring en 50% reduktion af CPU-tid kan brugerne forvente, lover ATI.

    Endelig giver AVIVO større båndbredde til DVI-udgangen og således vil det ikke længere være nødvendigt at bruge to udgange for at styre eksempelvis Apple's 30" Cinema LCD-skærm - det kan enkelt DVI-udgang fra AVIVO nu klare. Så er det jo bare på med fire af disse skærme til Crossfire setup'et.
  • Emillos
     
    Overclocker
    Tilføjet:
    18-11-2005 12:36:49
    Svar/Indlæg:
    14079/622
    Super test, dog ærgeligt at du ikke havde et 7800gt at sammenligne med. :)

    Kortet i sig selv ser meget lækkert ud.. håber at R520-chippen virkelig har en låst fysikberegningsdel, da dette kunne afhjælpe noget af CPU-begrænsningen :D.

    Forresten: "Med sine 16 pixelshaders og 8 vertexshader, som faktisk er det samme som sidste generation"
    Havde sidste generation ikke 6 vertexshaders ? :i



    Boomer
     
    Elitebruger
    Tilføjet:
    18-11-2005 17:02:33
    Svar/Indlæg:
    906/100
    BF2 testen har helt sikkert været foruden AA for med mit kort ser det meget bedre ud og jeg kører 6xAA. Men som du siger er det nok driver probs, og dem er der nok af. Ellers en fed test der går i detaljerne keep up the good work.



    Dragzonox
     
    Superbruger
    Tilføjet:
    19-11-2005 11:19:54
    Svar/Indlæg:
    185/49
    Jeg er typen som gerne vil have det nyest... Så jeg tænker på at købe Club3D udgave med 512ram..
    Meeen, da det ikke er vildt meget bedre end Nvidia ved jeg ikke hvad jeg vil købe?...
    Nogle godt forslag til at købe Club3D udgave frem for et nVidia 7800 GTX? ?:(



    kisker
     
    Overclocker
    Tilføjet:
    20-11-2005 14:34:08
    Svar/Indlæg:
    37/5
    korte tskulle jo være ret så stygt ;)

    skulle vist også komme i AGP :)