Test: Intel Core 2 Duo E6850

CPU, Intel d.  27. oktober. 2007, skrevet af Stensgaard 13 Kommentarer.  Vist: 31293 gange.

Korrekturlæser: 
Billed behandling: 
Oversættelse: 

Pristjek på http://www.pricerunner.dk 
Produkt udlånt af: Intel
DK distributør: InterData

Teknologien bag Core 2 Duo

 

Højere IPC – Flere instruktioner på samme tid

Med Core 2 har Intel valgt et design, der i langt højere grad end før fokuserer på en høj IPC. Dette er der flere grunde til, men at være mindre afhængig af clockfrekvensen har en række klare fordele.

Dels stiller det mindre krav til hvor høje ”trin” der skal være imellem de clockfrekvenser man tilbyder. Et spring i clockfrekvens på eksempelvis 200Mhz kan sagtens forsvares fordi ydelsesforskellen er til at øje på. Dette betyder dels noget for slutbrugerne, men på det professionelle marked kan dette være rigtig fornuftigt fordi man få kunderne til løbende at opgradere til nyeste processorer fordi de kan mærke en reel forbedring i ydelsen. AMD har med stor succes gjort dette med Opteron-processoren, som på 2½ år er gået fra max 2GHz clockfrekvens til max 2.8GHz for hurtigste model. Ikke ligefrem et kvantespring, men trinene har været store nok til at folk har fundet det rimeligt at opgradere.

En anden fordel ved at være mindre afhængig af clockfrekvensen finder man i den anden ende af skalaen. Intel fik med Pentium M processoren vist at SpeedStep – hvor man dynamisk ændrer clockfrekvensen og processorspændingen efter behovet for regnekraft – havde enormt potentiale. AMD tog dette op med Cool’n’Quiet i deres K8 processorer og for begge arkitekturer gjaldt det at man selv ved lav clockfrekvens havde en fair ydelse – ene og alene fordi IPC’en var høj.

Dette er endnu en grund til at den høje IPC bør være vinder, men hvordan har Intel så grebet sagen an? Dels har man valgt en noget reduceret pipeline, som er på 14 stages. En kort pipeline er dog i så selv ikke alene nok til at give mere effektivitet, så Intel har tilført Wide Dynamic Execution. ”Almindelig” Dynamic Execution handler om at snyde processoren til at se en række instruktioner som én stor instruktion og derfor tage disse samlet og i rækkefølge. Grunden til at Dynamic Execution nu er blevet ”Wide” er at Intel i Core 2 arkitekturen har tilføjet en ny decoder og execution unit, så processoren nu kan håndtere fire x86 instruktioner samtidigt. Både Intel’s tidligere og AMD’s nuværende processorer kan maksimalt køre 3 x86 instruktioner samtidigt. Man får altså ikke bare en kortere pipeline, men også en bredere pipeline, som yderligere hæver IPC’en.

 

Mere cache

Dertil har man øget mængden af L1 cache i forhold til Pentium 4. Core 2 processorerne vil få 64KB L1 cache, hvilket er fordelt ligeligt imellem data og instruktion. Dette er langt mere L1 cache end i Pentium 4 arkitekturen, der grundlæggende havde 8KB L1 cache til data og 12KB til instruktion. Da Intel skiftede fra Northwood til Prescott blev mængden af cache til data fordoblet fra 8KB til 16KB, men Core processorerne har altså mere end det dobbelte.

L2 cache bliver på enten 2MB eller 4MB afhængigt af model, men da der er tale om dual-core processorer vil L2 cache’en blive delt imellem de to CPU kerner. Dette sker fordi Intel har implementeret deres Smart Cache. Med den kan man dynamisk allokere cache-mængde til hver enkelt processorkerne. Kører man således en applikation, som kun kan udnytte den ene processor vil denne ene processor få den fulde mængde cache til sin rådighed.

Dette er på papiret smart, men som man hurtigt vil se så er denne feature meget lidt værd i praksis – en dual-core processor vil nemlig næsten altid bruge begge cores i større eller mindre grad fordi operativsystemet (og flere andre underliggende applikationer) bruger CPU-tid. Derfor har Intel med deres Smart Cache implementeret en Crossbar funktion, som dynamisk deler cache-mængden imellem de to processorkerner.

Udover denne glimrende funktion har Intel gjort en del for at pre-fetche data til cache’en endnu bedre end før. Dels er selve pre-fetch algoritmen optimeret, men en ny feature går ud på at hvis processor-kerne 1 skal bruge data som ligger i cache’en hos processor-kerne 2, så kan processor-kerne 1 tage den databid direkte. Tidligere ville man i dette tilfælde skulle have data’en ud af processor-kerne 2’s cache og ind i processoren igen, hvilket gav høj latency.

Men ikke kun data til cache pre-fetches bedre. Intel Smart Memory Access dækker over en generelt forbedret pre-fetch del i processoren. For x86 kode gælder det normalt at cirka 20 procent af instruktionerne kræver adgang til hukommelsen og her er netop prefetch-delen vigtig. Core 2 processorerne har her seks uafhængige pre-fetch enheder, der alle har en forbedret algoritme til at ramme præcis den data som processoren skal bruge. Dertil har Smart Memory Access fået en ny feature, som tillader at en ny instruktion kan startes selvom den er afhængig af resultatet af en tidligere instruktion – dette minimerer out-of-order, hvor en instruktion ellers må bremses fordi der ventes på data.

 

EM64T, SSE, osv.

En anden stor forbedring i Core 2 arkitekturen er at 64-bit understøttelsen er på plads i alle processorer. Intel benytter fortsat sin egen EM64T (Enhanced Memory 64 Technology) til at varetage 64-bit delen, men som Intel’s markedsføring tegner sig vil det primært blive på server-området at man vil slå på EM64T. Dette giver såmænd også ganske god mening, da der mangler langt bedre softwareunderstøttelse for at 64-bit kan blive en succes på desktoppen.

SSE instruktionssættet vil også blive forbedret i Core 2 arkitekturen. Således vil alle 128-bit SSE instruktioner nu kunne beregnes på en enkelt clockcyklus – tidligere krævede dette to af slagsen. Da SSE instruktioner oftest benyttes ved multimedia kalder Intel denne nye feature for Intel Advanced Digital Media Boost.

SSE4 finder også vej til Core 2 – Pentium 4 processorerne havde SSE, SSE2 og SSE3, men nu kommer der yderligere 8 instruktioner, som samles under SSE4 betegnelsen. Disse var tidligere tiltænkt Tejas-processoren, som Intel droppede til fordel for netop Core arkitekturen. Derfor blev disse også tidligere kaldt TNI (Tejas New Instructions), men er nu en del af SSE3.

NX (No eXecutable) Bit vil uændret finde vej til Core 2 og dermed tilbyde samme beskyttelse overfor skadelig kode, som Intel fik introduceret i sine seneste Pentium processorer. Også Intel’s VT (Virtualization Technology) vil være standard i Core 2 processorerne, der igen overtager disse teknologier uforandrede fra de seneste Pentium processorer.

 

Lavere strømforbrug

Strømforbruget har været en særdeles vigtig faktor i udviklingen af Core 2 arkitekturen og det har betydet at Intel yderligere har arbejdet på at sænke dette. Dels benytter man deres Enhanced SpeedStep, som tilpasser processorens clockfrekvens – og dertil også processorspændingen – til behovet for regnekraft.

Yderligere har man forbedret muligheden for at kunne lukke ned for dele af processoren når disse ikke skal bruges. Som en del af Intel’s Smart Cache har Intel implementeret at processoren kan lukke sin cache helt ned – simpelthen ved at flushe data’en – og synke til et endnu lavere energiniveau. Når der igen er brug for databehandling, som kræver cache, så startes den dynamisk op igen og processoren går tilbage i sit normale energiniveau. Denne feature så man allerede på Yonah-processoren, men nu finder den vej til Core 2 også.

Ydermere er Core 2 processoren delt ind i mange mindre områder end eksempelvis Pentium 4 var. Disse mindre dele kan derfor oftere lukkes ned, hvis der ikke er brug for dem og det giver igen et lavere effektforbrug.

En pudsig detalje omkring dette er at Intel dermed har fået svært ved at angive processorens temperatur. Undervejs i udviklingen fandt man simpelthen ud af at processortemperaturen kunne variere meget imellem de forskellige områder, hvorfor en almindelig løsning med en enkelt temperaturdiode ikke altid ville give et præcist billede af processorens temperatur. Derfor har man i Core 2 processorerne placeret flere dioder rundt i processoren og når man checker temperaturen på sin Core 2 processor er det faktisk et gennemsnit af disse forskellige værdier, som man aflæser.

 

Tak til Klaus S for disse ord

Martin.v.R
 
Elitebruger
Tilføjet:
27-10-2007 12:07:22
Svar/Indlæg:
8555/439
fint i bruger tid på det med ram,men i skulle bruge lidt mere tid på det ;)

ram ydelse på et P35 chip
http://www.xbitlabs.com/articl...

jeg er ikke vendt tilbage 😀


Stensgaard
 
Elitebruger
Tilføjet:
27-10-2007 12:28:05
Svar/Indlæg:
2620/327
#1 Ja, den artikel har du linket til før, og jeg har også læst den. Der står, at 1T Command Rate kun virker ved 5:6 og 5:8, og at det alligevel kun giver 0,5% ekstra ydelse i forhold til 2T.

Synes du, det er vigtigt at få det med?


Timozzdk
 
Elitebruger
Tilføjet:
27-10-2007 13:12:28
Svar/Indlæg:
1636/115
Hvorfor hedder den x6850 i 3dmark?


Anonym20219355916
 
Elitebruger
Tilføjet:
27-10-2007 14:36:44
Svar/Indlæg:
6181/270
#1 troede du var færdig med at være herinde?

lækker test bortset fra som #3 siger; hvorfor hedder den X6850 i benchmark testne?


Spenneth
 
Superbruger
Tilføjet:
27-10-2007 15:21:41
Svar/Indlæg:
5/0
Hvordan yder 6850'eren i forhold til Q6600'eren? da de har samme pris vil jeg godt vide vilken der var bedste at købe.


NoNig
 
Elitebruger
Tilføjet:
27-10-2007 15:26:15
Svar/Indlæg:
23132/740
-> #3 + #4

Måske fordi Core 2 Duo hedder et eller andet med 'X' foran? Ved det ikke, men tror det er derfor...


Polarfar
 
Senior Skribent
Tilføjet:
27-10-2007 15:47:13
Svar/Indlæg:
2309/846
# 3+4

Fordi det er en engineering sample....yes yes.....vi kender nogen der kender nogen 😀


Stensgaard
 
Elitebruger
Tilføjet:
27-10-2007 18:49:31
Svar/Indlæg:
2620/327
#3 + #4: Den er lige smuttet, beklager 😳 . Det skyldes, at vi først fik at vide, at det var en Core 2 Extreme X6850, som var på vej. Vi fandt så siden hen ud af, at det "bare" var en E6850. Som man kan se på billedet af CPU'en, er det en ES, så man kan ikke umiddelbart se, hvad den ellers er. Og diagrammerne er lavet, før vi fandt ud af fejlen.

#5 E6850 yder umiddelbart bedst, men Q6600 er bedre til seriøs multitasking.


Emillos
 
Overclocker
Tilføjet:
27-10-2007 18:54:27
Svar/Indlæg:
14079/622
->#5

Som Stensgaard siger, er en hurtig dualcore klart at foretrække frem for en mindre hurtig quadcore når man spiller og sådan nogle ting. For spil udnytter endnu ikke quadcore.

Men kører man flere programmer ad gangen, er en quadcore fed at have: http://hwt.dk/literaturedetail...


#10
JHBN
 
Overclocker
Tilføjet:
27-10-2007 21:38:06
Svar/Indlæg:
179/46
ok jeg er en lille noob til OC :'-(

men ser i testen at der køres på et bundkort som mit abit ip35 pro ( jeg har bare ip35) og en e6300 cpu men her køre den cpu 1333 fsp hved at sætte den til 333 mhz i bios.

kan jeg uden problemr gøre det samme. jeg har en god luft køler på? eller skal jeg ændre andet, er der noget der kan gå galt?

( er lidt presset af den nye crysis demo 😉 )


Stensgaard
 
Elitebruger
Tilføjet:
27-10-2007 23:53:14
Svar/Indlæg:
2620/327
#10 Du burde uden problemer kunne sætte FSB op fra 266 til 333. Og så længe du ikke piller ved spændinger/Vcore, er der ikke noget, der går helt galt.


isenkoldt
 
Overclocker
Tilføjet:
28-10-2007 19:09:03
Svar/Indlæg:
16/2
nogen der gider hjælpe mig med at overclocke min intel duo 2.4 6600
har ikke noget program til det !


Claus35
 
Elitebruger
Tilføjet:
29-10-2007 07:47:28
Svar/Indlæg:
5410/123
#10 + #12 I må lige oprettet en tråd, til det 🙂 Så vil vi lige gå tilbage til topic her 😉

Jeg er uenig med jer drenge..... jeg ville klart vælge en Q6600 frem for en E6850. Hvis du har kølingen, kan en quad jo også godt rende 3,8 - 4 ghz 😉
Mange af de nye spil. og programmer. understøtter jo 4 kerner, eller mere 😉 Som f.eks. Crysis.
Selv hvis de "kun" kan udnytte de to kerner, så kan quad core'en dedikere to kerner til spillet, og to til baggrundsressourcer.