Innovation/Teknologi
AMD Radeon HD 6970 er som sagt sat i verden for, at slå nVidia af tronen i det halvdyre 2500-kroners segment, efter nVidia med GTX 570 har vist, at de stadig kan lave slagkraftige grafikkort til en pris som entusiasterne er villige til at betale.
Helt præcist er klassens store dreng kommet for, at give GeForce GTX 570 kamp til stregen – og ikke nVidias flagskib GTX 580, som nogen måske havde regnet med. Det dobbelt-chippede Radeon HD 5970 er nemlig fortsat den hurtigste knallert på molen, ifølge AMD selv. Næste kort i serien med 2 GPU'er, der sandsynligvis døbes Radeon HD 6990, lader nemlig stadig vente på sig.
Med kroppen fyldt af forventningens glæde, åbner jeg det tilsendte pressemateriale fra AMD, der skal give et overblik over lanceringen. Første kig på specifikationerne for HD 6970, får dog mit hjerte til at springe et slag over: ”Compute Power: 2,7 TeraFLOPs”, ligesom HD5870 - har AMD slet ikke forbedret RV870-chippen?! Efter at have genfundet min normale hjerterytme, kigger jeg igen på specifikationerne.
Noget må AMD da have brugt det sidste år på?
|
Radeon HD 6970 |
Radeon HD 6870 |
Radeon HD 5870 |
Produktionsteknologi |
40 nm |
40 nm |
40 nm |
Chipstørrelse |
389 mm^2 |
255 mm^2 |
334 mm^2 |
Transistore |
2,64 milliarder |
1,7 milliarder |
2,15 milliarder |
GPU clock |
880 MHz |
900 MHz |
850 MHz |
Stream processore |
1536 |
1120 |
1600 |
Teksturenheder |
96 |
56 |
80 |
ROPs |
32 |
32 |
32 |
RAM mængde, type |
2GB GDDR5 |
1GB GDDR5 |
1GB GDDR5 |
RAM clock |
1375 MHz |
1050 MHz |
1200 MHz |
RAM bus |
256 bit |
256 bit |
256 bit |
RAM båndbredde |
176 GB/s |
134,4 GB/s |
153.6 GB/s |
PowerTune Max. forbrug |
250 Watt |
N/A |
N/A |
Typisk strømforbrug |
190 Watt |
151W |
188 Watt |
Typisk idleforbrug |
20 Watt |
19W |
27 Watt |
Ved nærmere inspektion kan jeg konstatere, at Cayman faktisk har en anelse færre Stream processore end sin forgænger Cypress. Til gengæld er clock hævet med 30MHz, og der er kommet 16 teksturenheder mere til. Kortets RAM er desuden blevet hurtigere og flere – 2GB GDDR5 ved 1375MHz på en 256bit bus, hvilket skulle levere 176GB/s.
Der er altså forbedringer at spore. Heldigvis har AMD også udbygget og raffineret deres chip. Det nye raffinement kaldes VLIW4 – og den skal forbedre GPU'ens ydelse, især med henblik på Tesselation og 32bit Floating Point operationer, der skulle være forbedret med hhv. 300% og 400% i forhold til RV870(HD5870). Ifølge AMD giver dette en typisk merydelse på 44% i spillet ”STALKER – CoP”, mens ydelsen i ”Unigine Heaven”-benchmarken skulle være forbedret med hele 69%. Og da det netop er disse Tessalation-tunge applikationer nVidia har siddet på, og da det efter alt at dømme er tendensen på spilmarkedet, giver forbedringerne rigtig god mening.
Forbedringerne har da heller ikke gjort Cayman-chippen hverken mindre eller mere strømbesparende. Faktisk har forbedringerne kostet næsten 500 millioner ekstra transistore på GPU'en, der nu sammenlagt består af hele 2,64 millarder af slagsen. Dette betyder, at chippen har fået vokseværk fra RV870's 334 mm^2 til 389 mm^2. Bagsiden af medaljen er altså at chippen er blevet dyrere end sin forgænger – et robust design koster. Der er dog stadig et stykke op til GTX 580, der består af 3,01 milliarder transistore.
Som følge af den større GPU, siger logikken, at strømforbruget også skulle være steget, ift. HD 5870. AMD fastholder dog, at kortet typisk vil bruge 190W som forgængeren – og bare 20W i idle - men at man vha. PowerTune kan komme helt op på 250W, der jo cirka er på nVidia-niveau(vore egne målinger følger naturligvis i Test-afsnittet). Som modtræk har AMD dog også muliggjort, at kortet kan justere strømforbruget meget præcist efter brugerens ønske vha. PowerTune-teknologien – mere herom længere nede.
Heldigvis benytter AMD sig fortsat af en stor køler, med Vapor Chamber teknologi – lidt ala en forvokset heatpipe – som vi kender det fra AMD's Radeon HD 5970 og senest GeForce GTX 570/580, som gør at varmen fordeles bedre fra GPU til køler, og derfor burde resultere i et støjsvagt kort.
Som noget helt nyt, leveres HD 6970 med dual BIOS, så man aldrig vil stå med at dødt grafikkort efter en BIOS-updatering/modificering. Det vil med garanti glæde en håndfuld overclockere.
Teknologier i fokus
PowerTune
PowerTune er en videreudvikling af ATI PowerPlay, der i sin tid var forbeholdt ATI's grafikkort til bærbare computere. Teknologien sørgede for at justere grafikchippens strømtilførsel og clock, alt efter hvor stor belastning GPU'en blev udsat for. PowerPlay blev senere implementeret på hele Radeon-serien fra HD 3000-serien, hvor også highend grafikkort til stationære computere dragede nytte af teknologien.
Hidtil har der ”kun” været 3 belastningskategorier: Ingen belastning, mellem belastning, og høj belastning. Strømtilførsel og clockfrekvens har altså været justeret på 3 niveauer.
Nu har AMD taget skridtet videre og har raffineret teknologien, således at strømtilførsel og clock kan styres meget præcist. Hvis et spil eksempelvis kører med meget svingende framerate, vil PowerTune både op- og ned-justere clock således at frameraten stabiliseres. Og kører et spil med 200 billeder pr. sekund, hvor skærmen alligevel kan kan vise måske 50/100 billeder pr. sekund, nedsættes hastigheden på GPU'en, så strømforbruget sænkes uden det kan mærkes for brugeren. Hvor meget GPU clock skal kunne ændres, kan man naturligvis selv indstille i Catalyst Control Center under OverDrive.
Eyefinity
Eyefinity er, i løbet af det seneste års tid, virkelig blevet et af de helt store salgsparametre hos AMD. Teknologien tillader helt almindelige brugere, med selv relativt billige Radeon grafikkort, at tilkoble 2,3,4,5 eller 6 skærme; noget der direkte udvider brugeroplevelsen voldsomt. Mest populær er naturligvis 3 skærme til spil; noget der førhen var forbeholdt specielle grafikkort fx fra producenten Matrox, hovedsageligt til brug i bl.a. flysimulatore.
Anno 2010 er et setup med 3 skærme dog fuldt anvendeligt, til en bred skare af spiltitler og -typer. Herover ses Colin McRae: DiRT og - selvfølgelig - World of Warcraft.
3 skærme kræver desuden ikke andet end 3 skærme med MiniDisplayPort. Skærme med andre typer tilslutninger kan dog også gøre det – så skal man bare være opmærksom på, at der kræves aktive adaptere.
Læs evt. vores detaljerede anmeldelse af Eyefinity her: http://hwt.dk/literaturedetails.aspx?LiteratureID=17248
CrossFireX
CrossFireX er AMD's bud på nVidias famøse SLi. CrossFireX gør det muligt, at sætte flere grafikkort sammen – 2, 3 eller 4 og dermed, i teorien, firdoble ydelsen. For at opnå den optimale ydelse med 2 kort, skal man koble 2 ens Radeon grafikkort sammen med en CrossFireX-bro. Bundkortet det hele foregår på, skal naturligvis have 2 fysiske Pci-Express x16-porte, og skal understøtte CrossFireX – hvilket næsten alle ATX-bundkort i dag gør.
Den reelle ydelse man får ud af et CrossFireX setup varierer dog meget. AMD selv hævder at CrossFireX skalerer næsten 200% med 2 kort i en række spiltitler – og selv har vi også oplevet, at ydelsen næsten fordobles med 2 kort i visse spiltitler. Det varierer dog fra spil til spil – og sætter man 3 eller 4 kort sammen, skal man ikke regne med at udnyttelsen af disse er i nærheden af de 100%.
Unified Video Decoder 3
Teknologien svarer på mange måder til den nyeste version af nVIDIAs Purevideo, der ligeledes er blevet integreret i deres mainstreamprodukter. UVD er baseret på ATi's Xilleon video processor , som var en 32 bit "system-on-a-chip" MIPS processor. Nu er den så blevet integereret i GPU'erne, til formål at aflaste CPUen og få videomateriale til at tage sig bedre ud. Dette gøres vha. de-interlancing, farvejustering, og støjreduktion.
UVD3 kan håndtere BluRay-materiale med bitrates op til 40Mbit/s, og kan teoretisk set dekode alt materiale indenfor H.264, VC-1, MPEG4 og DivX/xVid video codec standarderne næsten uden CPU-kraft.
Herunder hører også Accelerated Video Transcoding, der får grafikkortet til at dekode videomateriale, således at man kan convertere videomateriale langt hurtigere, end hvis CPU'en skulle gøre arbejdet alene. I praksis kan dette mere end halvere tiden det tager at konvertere en fil – og med Windows 7 kan man benytte sig af ”Drag 'n drop” transcoding, så man ikke engang behøver tredjeparts software.
Også tredjepartsprogrammer såsom Cyberlink MediaShow Espresso kan udnytte Radeon grafikkort til at hjælpe med video-dekodning.
Enhanced Quality Anti-Aliasing
MSAA, som er en af de gængse standarder indenfor industrien, kender de fleste. Det er med til at give en fiktiv højere opløsning end det ellers ville være muligt. En egenskab der især er en fordel på fladskærme der kun har en til to ægte-opløsninger. 4x, står for 4 gange så mange pixels, og det giver sig til syne på skærmen som få eller ingen blinkende pixels, og ingen ujævne og hakkede kanter.
AMD har dog lanceret deres egen version, Morphological Anti-Aliasing, hvor de efter at have renderet et billede, kører det igennem shaderen igen for at udglatte kanter. Dette skulle give et bedre billede, med en minimal påvirkning af ydelsen.
(Tak til Emillos for dette afsnit)