Test: Intel Wolfdale E8400

CPU, Intel d.  12. april. 2008, skrevet af Polarfar 14 Kommentarer.  Vist: 26263 gange.

Korrekturlæser: 
Billed behandling: 
Oversættelse: 

Pristjek på http://www.pricerunner.dk 
Produkt udlånt af: Intel
DK distributør: Tech Data

Teknologi - Core 2 Duo


 

Højere IPC – Flere instruktioner på samme tid

Med Core 2 har Intel valgt et design, der i langt højere grad end før fokuserer på en høj IPC ( Instructions Per clock Cycle). Groft sagt betyder det at man kan skubbe flere data igennem chippen per clockpuls. Der er flere grunde til at ønske en højere IPC, for det har en række klare fordele at være mindre afhængig af clockfrekvensen.

Dels stiller det mindre krav til hvor høje ”trin” der skal være imellem de clockfrekvenser man tilbyder. Et spring i clockfrekvens på eksempelvis 200Mhz kan sagtens forsvares fordi ydelsesforskellen er til at øje på. Dette betyder dels noget for slutbrugerne, men på det professionelle marked kan dette være rigtig fornuftigt fordi man få kunderne til løbende at opgradere til nyeste processorer fordi de kan mærke en reel forbedring i ydelsen. AMD har med stor succes gjort dette med Opteron-processoren, som på 2½ år er gået fra max 2GHz clockfrekvens til max 2.8GHz for hurtigste model. Ikke ligefrem et kvantespring, men trinene har været store nok til at folk har fundet det rimeligt at opgradere.

En anden fordel ved at være mindre afhængig af clockfrekvensen finder man i den anden ende af skalaen. Intel fik med Pentium M processoren vist at SpeedStep – hvor man dynamisk ændrer clockfrekvensen og processorspændingen efter behovet for regnekraft – havde enormt potentiale. AMD tog dette op med Cool’n’Quiet i deres K8 processorer og for begge arkitekturer gjaldt det at man selv ved lav clockfrekvens havde en fair ydelse – ene og alene fordi IPC’en var høj.

Dette er endnu en grund til at den høje IPC bør være vinder, men hvordan har Intel så grebet sagen an? Dels har man valgt en noget reduceret pipeline, som er på 14 stages. En kort pipeline er dog i så selv ikke alene nok til at give mere effektivitet, så Intel har tilført Wide Dynamic Execution. ”Almindelig” Dynamic Execution handler om at snyde processoren til at se en række instruktioner som én stor instruktion og derfor tage disse samlet og i rækkefølge. Grunden til at Dynamic Execution nu er blevet ”Wide” er at Intel i Core 2 arkitekturen har tilføjet en ny decoder og execution unit, så processoren nu kan håndtere fire x86 instruktioner samtidigt. Både Intel’s tidligere og AMD’s nuværende processorer kan maksimalt køre 3 x86 instruktioner samtidigt. Man får altså ikke bare en kortere pipeline, men også en bredere pipeline, som yderligere hæver IPC’en.

 



Mere cache

Dertil har man øget mængden af L1 cache i forhold til Pentium 4. Core 2 processorerne har fået 64KB L1 cache, hvilket er fordelt ligeligt imellem data og instruktion. Dette er langt mere L1 cache end i Pentium 4 arkitekturen, der grundlæggende havde 8KB L1 cache til data og 12KB til instruktion. Da Intel skiftede fra Northwood til Prescott blev mængden af cache til data fordoblet fra 8KB til 16KB, men Core processorerne har altså mere end det dobbelte.

L2 cache bliver på enten 2, 4 eller 6MB ( på 45nm ) afhængigt af model, men da der er tale om dual-core processorer vil L2 cache’en blive delt imellem de to CPU kerner. Dette sker fordi Intel har implementeret deres Smart Cache. Med den kan man dynamisk allokere cache-mængde til hver enkelt processorkerne. Kører man således en applikation, som kun kan udnytte den ene processor vil denne ene processor få den fulde mængde cache til sin rådighed.

Dette er på papiret smart, men som man hurtigt vil se så er denne feature meget lidt værd i praksis – en dual-core processor vil nemlig næsten altid bruge begge cores i større eller mindre grad fordi operativsystemet (og flere andre underliggende applikationer) bruger CPU-tid. Derfor har Intel med deres Smart Cache implementeret en Crossbar funktion, som dynamisk deler cache-mængden imellem de to processorkerner.

Udover denne glimrende funktion har Intel gjort en del for at pre-fetche data til cache’en endnu bedre end før. Dels er selve pre-fetch algoritmen optimeret, men en ny feature går ud på at hvis processor-kerne 1 skal bruge data som ligger i cache’en hos processor-kerne 2, så kan processor-kerne 1 tage den databid direkte. Tidligere ville man i dette tilfælde skulle have data’en ud af processor-kerne 2’s cache og ind i processoren igen, hvilket gav høj latency.

 

 



Men ikke kun data til cache pre-fetches bedre. Intel Smart Memory Access dækker over en generelt forbedret pre-fetch del i processoren. For x86 kode gælder det normalt at cirka 20 procent af instruktionerne kræver adgang til hukommelsen og her er netop prefetch-delen vigtig. Core 2 processorerne har her seks uafhængige pre-fetch enheder, der alle har en forbedret algoritme til at ramme præcis den data som processoren skal bruge. Dertil har Smart Memory Access fået en ny feature, som tillader at en ny instruktion kan startes selvom den er afhængig af resultatet af en tidligere instruktion – dette minimerer out-of-order, hvor en instruktion ellers må bremses fordi der ventes på data.

EM64T, SSE, osv.

En anden stor forbedring i Core 2 arkitekturen er at 64-bit understøttelsen er på plads i alle processorer. Intel benytter fortsat sin egen EM64T (Enhanced Memory 64 Technology) til at varetage 64-bit delen, men som Intel’s markedsføring tegner sig vil det primært blive på server-området at man vil slå på EM64T. Dette giver såmænd også ganske god mening, da der mangler langt bedre softwareunderstøttelse for at 64-bit kan blive en succes på desktoppen.

SSE instruktionssættet vil også blive forbedret i Core 2 arkitekturen. Således vil alle 128-bit SSE instruktioner nu kunne beregnes på en enkelt clockcyklus – tidligere krævede dette to af slagsen. Da SSE instruktioner oftest benyttes ved multimedia kalder Intel denne nye feature for Intel Advanced Digital Media Boost.

 

 



SSE4 finder også vej til Core 2 – Pentium 4 processorerne havde SSE, SSE2 og SSE3, men nu kommer der yderligere 8 instruktioner, som samles under SSE4 betegnelsen. Disse var tidligere tiltænkt Tejas-processoren, som Intel droppede til fordel for netop Core arkitekturen. Derfor blev disse også tidligere kaldt TNI (Tejas New Instructions), men er nu en del af SSE3.

NX (No eXecutable) Bit vil uændret finde vej til Core 2 og dermed tilbyde samme beskyttelse overfor skadelig kode, som Intel fik introduceret i sine seneste Pentium processorer. Også Intel’s VT (Virtualization Technology) vil være standard i Core 2 processorerne, der igen overtager disse teknologier uforandrede fra de seneste Pentium-processorer.

Lavere strømforbrug

Strømforbruget har været en særdeles vigtig faktor i udviklingen af Core 2 arkitekturen og det har betydet at Intel yderligere har arbejdet på at sænke dette. Dels benytter man deres Enhanced SpeedStep, som tilpasser processorens clockfrekvens – og dertil også processorspændingen – til behovet for regnekraft.

Yderligere har man forbedret muligheden for at kunne lukke ned for dele af processoren når disse ikke skal bruges. Som en del af Intel’s Smart Cache har Intel implementeret at processoren kan lukke sin cache helt ned – simpelthen ved at flushe data’en – og synke til et endnu lavere energiniveau. Når der igen er brug for databehandling, som kræver cache, så startes den dynamisk op igen og processoren går tilbage i sit normale energiniveau. Denne feature så man allerede på Yonah-processoren, men nu finder den vej til Core 2 også.

Ydermere er Core 2 processoren delt ind i mange mindre områder end eksempelvis Pentium 4 var. Disse mindre dele kan derfor oftere lukkes ned, hvis der ikke er brug for dem og det giver igen et lavere effektforbrug.

En pudsig detalje omkring dette er at Intel dermed har fået svært ved at angive processorens temperatur. Undervejs i udviklingen fandt man simpelthen ud af at processortemperaturen kunne variere meget imellem de forskellige områder, hvorfor en almindelig løsning med en enkelt temperaturdiode ikke altid ville give et præcist billede af processorens temperatur. Derfor har man i Core 2 processorerne placeret flere dioder rundt i processoren og når man checker temperaturen på sin Core 2 processor er det faktisk et gennemsnit af disse forskellige værdier, som man aflæser.

 

SoundWave
 
Elitebruger
Tilføjet:
12-04-2008 10:44:40
Svar/Indlæg:
3011/103
Fed test. Tror du det er vandkølingen der gør, at du kan komme så højt op, for jeg har læst på flere udenlandske sider, at visse brugere topper omkring 3.8-4.0GHz med luftkøling - og så med en anden stepping naturligvis?!


Alco
 
Superbruger
Tilføjet:
12-04-2008 11:41:11
Svar/Indlæg:
322/30
God test.

Ved godt i ikke har meget tid til at teste i, men er den 24/7 stabil ved 4.5GHz?

Min kører 4,32GHz stabilt, også med vand på. Så helt klart en über nice CPU til prisen.


Milez_Teg
 
Superbruger
Tilføjet:
12-04-2008 11:50:33
Svar/Indlæg:
3/0
Fin nok test men hvorfor har i ikke en sammenligning med AMD?? Uanset hvad der vil vinde testen i dette tilfælde synes jeg ikke at det er særligt givende kun at holde sig til 1 producent. Når man f.eks. tester graffikkort er det jo heller ikke givende at have nvidia only eller ati only. Hvis man overvejer et skifte kan man jo slet ikke forholde sig til hvilken performance man får/mister ved et skifte.
Man kan sikkert finde sårn nogle tests andre steder men se det som konstruktiv kritik. I skulle jo gerne beholde status som et sted man kigger forbi ;)


Gilbert
 
Elitebruger
Tilføjet:
12-04-2008 11:51:54
Svar/Indlæg:
4089/252
Har lige fået en idag, og den er pt nået op på 3.7ghz med std vcore og luftkøling.

49 grader under orthos.


hamderD
 
Elitebruger
Tilføjet:
12-04-2008 11:51:59
Svar/Indlæg:
7263/260
Lækker test :yes:


Polarfar
 
Senior Skribent
Tilføjet:
12-04-2008 13:44:35
Svar/Indlæg:
2309/846
#3

Jeg overvejede at tage Phenom resultaterne med i graferne, men jeg har valgt at lade være da den er testet på en helt anden platform. Jeg har også kun resultater for en P9600 liggende og det ville se lidt underligt ud med en enkelt AMD chip midt i et hav af Intels.

Men efterhånden som vi får testet flere Phenoms med tre og fire kerner vil vi naturligvis lave et oversigtskort over ydelsen på AMD vs. Intel også, men det var ikke formålet med denne test.



jakob3k
 
Superbruger
Tilføjet:
12-04-2008 14:15:51
Svar/Indlæg:
440/3
Fin test. Dog undres jeg lidt over, at den kun får 4 i pris. Spørgsmålet er, om der nogensinde har været et bedre dual core-køb for seriøse overclockere!?


Polarfar
 
Senior Skribent
Tilføjet:
12-04-2008 15:21:34
Svar/Indlæg:
2309/846
UPS...har lige opdaget at der har indsneget sig en fejl. I Crysis demoen er Obejcts Quality sat til HIGH, resten er LOW. Det gælder heldigvis for alle resultaterne så grafen passer godt nok med de settings.

Opdagede fejlen da jeg flyttede systemet over på en Raptor og det pludselig gav et avg. på 50fps mere ved LOW settings. SÅ meget skulle det ikke give at skifte disk.

beklager "fejlen". Resultatlisten bliver rettet snarest muligt 😳


jakob3k
 
Superbruger
Tilføjet:
12-04-2008 16:12:23
Svar/Indlæg:
440/3
Polarfar > Hehe... Ellers skal jeg love for, at der lige pludselig ville komme ekstra gang i salget af Raptor'er! 😀


Milez_Teg
 
Superbruger
Tilføjet:
12-04-2008 16:24:32
Svar/Indlæg:
3/0
Raptor er seriøst nice disks :) Er super glad for min. Skiftede fra 2 7200 rpm i raid 0 (pga. datatab osv) til raptor.. kunne stort set ikke mærke forskel


jakob3k
 
Superbruger
Tilføjet:
12-04-2008 16:29:10
Svar/Indlæg:
440/3
#10

Men du fik vel ikke 50fps mere ved LOW settings i Crysis-demoen!? 😀


Milez_Teg
 
Superbruger
Tilføjet:
12-04-2008 18:05:07
Svar/Indlæg:
3/0
#11 nej nok ikke 50fps mere ;) kommenterede blot at raptor diske har rigtig nice performance hvis man har sit OS derpå. Glemte at kommentere det med phenom. Det er fair nok ikke at tage dem med hvis der er FOR store forskelle på setups. Det ville dog have været rart at se hvordan en phenom f.eks. eller bare en alm amd 64 x2 klarede sig til sammenligning. Den vil formegentligt klare sig værre primært pga cache men ville være sjovt at se HVOR stor forskel der var. Må hellere google om der er andre der har lavet en sådanne test. :) Ud over det er det en nice anmeldelse. 🙂


zound
 
Superbruger
Tilføjet:
12-04-2008 22:53:05
Svar/Indlæg:
537/9
Kan det virkelig passe at e3110 xeon clocker bedre end e8400 har set en der fik den op på 603Mhz Fsb


cornerrage
 
Elitebruger
Tilføjet:
13-04-2008 00:44:20
Svar/Indlæg:
3532/303
#13 Det der kan man jo ikke sige :) CPU'er er ret individuelle hvad angår max overclock. Desuden kommer det også an på køling, bundkort etc. Der er sikkert også nogle e8400 der kan komme op og sætte en WR i superpi, men derfor kan man stadig være uheldig og få en mandags model som måske næsten intet vil 🙂