Bag om Phenom II
Phenom II er AMD's første produktion af 45nm chips overhovedet. Før har Phenom-serien i 65nm produktion været den bedst ydende arkitektur fra AMD - men det er langt langt fra det eneste, der er forbedret og opdateret i den nye serie. Vi har derfor valgt at inddele denne sektion i 5 hovedpunkter, der kommer omkring alle nyhederne ved Phenom II. På den måde håber vi, det er lidt lettere som læser at forstå, hvad det er - der gør Phenom II hurtigere og bedre.
I AMD's pressemateriale fandt vi også denne oversigt, der meget godt illustrerer, hvad der er gjort for at forbedre ydelsen.
Størrelsen
Vi starter med at kigge på, hvad det præcist betyder at skifte fra 65nm til 45nm, når man ser på de fysiske rammer.
CPU |
Athlon X2 |
Phenom |
Phenom II |
Størrelse |
230 mm2 |
285 mm2 |
258 mm2 |
Transistorerer |
227 Mill. |
450 Mill. |
758 Mill. |
Som det fremgår af ovenstående tabel, så er der nu blevet plads til hele 758 millioner transistorer, mod de bare 450 millioner på den gamle Phenom-kerne, samtidig med at den fysiske størrelse faktisk er blevet en del mindre. Til sammenligning kan vi også se at en dualcore Athlon X2 på den gamle 65nm teknologi, er håbløst bagud i antallet af transistorer og dermed selvfølgelig også i ren, rå regnekraft. Det bringer os hurtigt til det næste punkt, nemlig det øgede antal af instruktioner.
Flere instruktioner pr. clock cyklus
Med flere transistorer er det muligt at klemme flere instruktioner ud pr. clock cyklus og AMD har forbedret og optimeret denne process yderligere ift. den gamle, sådan at der er mere regnekraft at hente, uden at tilføje yderligere, deciderede instruktions-sæt.
Højere clock frekvens
Endnu engang kan vi takke springet fra 65nm til 45nm for, at der er mere ydelse at hente - denne gang i den mest åbenlyse form; Mega Hertz. I samme omgang er den nødvendige volt krævet pr. MHz sænket betydeligt. Dette sammen med forbedring af microarkitekturen har gjort det muligt for AMD at opnå den højere clock frekvens. Hvor den gamle Phenom-serie kun kunne tilbyde op til 2.6 GHz, kommer de nye Phenom II pt. med op til 3.2 GHz standard, men der er annonceret flere modeller helt op til 3.5 GHz i den kommende tid.
Forøgelse af L3 cachen
På 65nm var det ikke muligt at få plads til mere end 2 MB L3 cache, da det simpelthen ville ha' skudt strømforbruget for højt i vejret. Springet til 45nm har igen sat sit aftryk og har muliggjort helt op til 6 MB L3 cache. L1 og L2 cachen på hhv. 64 KB og 512 KB, er der til gengæld ikke pillet ved.
DDR3 support
Et yderligere skridt på ydelses-stigen kommer i form af DDR3 understøttelse. Officielt er der understøttelse for op til 1333 MHz DDR3 i dualchannel, men det tal skal man ikke vægte så tungt, for enten kan man overclocke til noget "uofficielt", eller også kommer understøttelsen hen ad vejen, når ellers bundkortproducenterne tør at skrue op for hastigheden i form af nye BIOS-revisioner. AMD har smart nok valgt at kalde alle CPU'er med DDR3 controller indbygget for AM3.
Dragon
Chipsettet til Dragon er stadig det samme som på Spider platformen, der kom med første generation af Phenom, nemlig 790FX modellen. Mens grafikkortene i mellemtiden har sneget sig op i HD4800 klassen. Og så kommer naturligvis stjernen i foretagendet, Phenom II processoren. Lad os lige tage et kig på hvad der er sket siden version I.
Den oprindelige Phenom er, trods den lave ydelse, faktisk noget af det mest moderne man kan komme i nærheden af når vi snakker arkitektur. Rent teknisk set er Phenom lysår foran Intels Core 2 teknik, der stadig hænger på en chipset arkitektur fra ruder konges tid. Faktisk kan man sige at Intels Core i7 er et forsøg på at indhente de innovative ideer, der ligger i Phenom arkitekturen, som den integrerede memory controller og Hypertransport bussen. Onde tunger vil måske ligefrem sige, at Intel kopierer AMD. Men men men...der er nogle få, men afgørende forskelle på Phenom og Core i7.
Den vel nok vigtigste er måden den interne cache håndteres på. Core i7 kører med en såkaldt inclusive cache, hvor alle data fra level 1 og 2 cachen er at finde i level 3 cachen også. Det gør, at en hvilken som helst af de fire kerner kan finde alle data på ethvert givent tidspunkt på et enkelt sted. Det giver en hurtigere afvikling af data, da der ikke er nogen reel søgetid.
Phenom bruger en exclusive cache, der ikke deler sine data med L3 cachen, men beholder data ved den kerne, der afvikler instruktionerne. Det gør, at hvis en anden kerne bliver sat til at hjælpe med afviklingen af et program, så skal den over til den anden kerne og sniffe data fra dens L2 cache, inden den kan komme i gang med arbejdet. Til gengæld har man hele L3 cachen fri, da der ikke skal ligge en masse duplikeret kode og flyde rundt. En anden ulempe ved det system er, at man ikke kan slukke for en kerne, der ligger inde med data, der skal bruges af en anden kerne. Den er nødt til at være aktiv, selvom den reelt ikke benyttes. Det er en af de nye ting i Phenom II, at en kerne kan lave et dump af Level 1 og Level 2 cachen til den større Level 3 cache, hvis kernen ikke skal bruges. Det skulle øge effektiviteten og så er det selvfølgelig et plus at der er hele 6MB Level 3 cache i Phenom II, hvor Phenom I kun har 2MB. Der er naturligvis stadig integreret memory controller.
Tak til Polarfar for afsnittet om Dragon, og den mere dybdegående analyse af selve Phenom II arkitekturen.