Test: Core 2 Duo duel - E6300 vs. E6600 vs. X6800

CPU, Intel d.  13. januar. 2007, skrevet af Stensgaard 33 Kommentarer.  Vist: 42832 gange.

Korrekturlæser: 
Billed behandling: 
Oversættelse: 

Pristjek på http://www.pricerunner.dk 
Produkt udlånt af: Sd-Data A/S
DK distributør: Sd-Data A/S

Teknologien bag Core 2 Duo



Højere IPC – Flere instruktioner på samme tid

Med Core 2 har Intel valgt et design, der i langt højere grad end før fokuserer på en høj IPC. Dette er der flere grunde til, men at være mindre afhængig af clockfrekvensen har en række klare fordele.

Dels stiller det mindre krav til hvor høje ”trin” der skal være imellem de clockfrekvenser man tilbyder. Et spring i clockfrekvens på eksempelvis 200Mhz kan sagtens forsvares fordi ydelsesforskellen er til at øje på. Dette betyder dels noget for slutbrugerne, men på det professionelle marked kan dette være rigtig fornuftigt fordi man få kunderne til løbende at opgradere til nyeste processorer fordi de kan mærke en reel forbedring i ydelsen. AMD har med stor succes gjort dette med Opteron-processoren, som på 2½ år er gået fra max 2GHz clockfrekvens til max 2.8GHz for hurtigste model. Ikke ligefrem et kvantespring, men trinene har været store nok til at folk har fundet det rimeligt at opgradere.

En anden fordel ved at være mindre afhængig af clockfrekvensen finder man i den anden ende af skalaen. Intel fik med Pentium M processoren vist at SpeedStep – hvor man dynamisk ændrer clockfrekvensen og processorspændingen efter behovet for regnekraft – havde enormt potentiale. AMD tog dette op med Cool’n’Quiet i deres K8 processorer og for begge arkitekturer gjaldt det at man selv ved lav clockfrekvens havde en fair ydelse – ene og alene fordi IPC’en var høj.

Dette er endnu en grund til at den høje IPC bør være vinder, men hvordan har Intel så grebet sagen an? Dels har man valgt en noget reduceret pipeline, som er på 14 stages. En kort pipeline er dog i så selv ikke alene nok til at give mere effektivitet, så Intel har tilført Wide Dynamic Execution. ”Almindelig” Dynamic Execution handler om at snyde processoren til at se en række instruktioner som én stor instruktion og derfor tage disse samlet og i rækkefølge. Grunden til at Dynamic Execution nu er blevet ”Wide” er at Intel i Core 2 arkitekturen har tilføjet en ny decoder og execution unit, så processoren nu kan håndtere fire x86 instruktioner samtidigt. Både Intel’s tidligere og AMD’s nuværende processorer kan maksimalt køre 3 x86 instruktioner samtidigt. Man får altså ikke bare en kortere pipeline, men også en bredere pipeline, som yderligere hæver IPC’en.

Mere cache

Dertil har man øget mængden af L1 cache i forhold til Pentium 4. Core 2 processorerne vil få 64KB L1 cache, hvilket er fordelt ligeligt imellem data og instruktion. Dette er langt mere L1 cache end i Pentium 4 arkitekturen, der grundlæggende havde 8KB L1 cache til data og 12KB til instruktion. Da Intel skiftede fra Northwood til Prescott blev mængden af cache til data fordoblet fra 8KB til 16KB, men Core processorerne har altså mere end det dobbelte.

L2 cache bliver på enten 2MB eller 4MB afhængigt af model, men da der er tale om dual-core processorer vil L2 cache’en blive delt imellem de to CPU kerner. Dette sker fordi Intel har implementeret deres Smart Cache. Med den kan man dynamisk allokere cache-mængde til hver enkelt processorkerne. Kører man således en applikation, som kun kan udnytte den ene processor vil denne ene processor få den fulde mængde cache til sin rådighed.

Dette er på papiret smart, men som man hurtigt vil se så er denne feature meget lidt værd i praksis – en dual-core processor vil nemlig næsten altid bruge begge cores i større eller mindre grad fordi operativsystemet (og flere andre underliggende applikationer) bruger CPU-tid. Derfor har Intel med deres Smart Cache implementeret en Crossbar funktion, som dynamisk deler cache-mængden imellem de to processorkerner.

Udover denne glimrende funktion har Intel gjort en del for at pre-fetche data til cache’en endnu bedre end før. Dels er selve pre-fetch algoritmen optimeret, men en ny feature går ud på at hvis processor-kerne 1 skal bruge data som ligger i cache’en hos processor-kerne 2, så kan processor-kerne 1 tage den databid direkte. Tidligere ville man i dette tilfælde skulle have data’en ud af processor-kerne 2’s cache og ind i processoren igen, hvilket gav høj latency.



Men ikke kun data til cache pre-fetches bedre. Intel Smart Memory Access dækker over en generelt forbedret pre-fetch del i processoren. For x86 kode gælder det normalt at cirka 20 procent af instruktionerne kræver adgang til hukommelsen og her er netop prefetch-delen vigtig. Core 2 processorerne har her seks uafhængige pre-fetch enheder, der alle har en forbedret algoritme til at ramme præcis den data som processoren skal bruge. Dertil har Smart Memory Access fået en ny feature, som tillader at en ny instruktion kan startes selvom den er afhængig af resultatet af en tidligere instruktion – dette minimerer out-of-order, hvor en instruktion ellers må bremses fordi der ventes på data.

EM64T, SSE, osv.

En anden stor forbedring i Core 2 arkitekturen er at 64-bit understøttelsen er på plads i alle processorer. Intel benytter fortsat sin egen EM64T (Enhanced Memory 64 Technology) til at varetage 64-bit delen, men som Intel’s markedsføring tegner sig vil det primært blive på server-området at man vil slå på EM64T. Dette giver såmænd også ganske god mening, da der mangler langt bedre softwareunderstøttelse for at 64-bit kan blive en succes på desktoppen.

SSE instruktionssættet vil også blive forbedret i Core 2 arkitekturen. Således vil alle 128-bit SSE instruktioner nu kunne beregnes på en enkelt clockcyklus – tidligere krævede dette to af slagsen. Da SSE instruktioner oftest benyttes ved multimedia kalder Intel denne nye feature for Intel Advanced Digital Media Boost.



SSE4 finder også vej til Core 2 – Pentium 4 processorerne havde SSE, SSE2 og SSE3, men nu kommer der yderligere 8 instruktioner, som samles under SSE4 betegnelsen. Disse var tidligere tiltænkt Tejas-processoren, som Intel droppede til fordel for netop Core arkitekturen. Derfor blev disse også tidligere kaldt TNI (Tejas New Instructions), men er nu en del af SSE3.

NX (No eXecutable) Bit vil uændret finde vej til Core 2 og dermed tilbyde samme beskyttelse overfor skadelig kode, som Intel fik introduceret i sine seneste Pentium processorer. Også Intel’s VT (Virtualization Technology) vil være standard i Core 2 processorerne, der igen overtager disse teknologier uforandrede fra de seneste Pentium processorer.

Lavere strømforbrug

Strømforbruget har været en særdeles vigtig faktor i udviklingen af Core 2 arkitekturen og det har betydet at Intel yderligere har arbejdet på at sænke dette. Dels benytter man deres Enhanced SpeedStep, som tilpasser processorens clockfrekvens – og dertil også processorspændingen – til behovet for regnekraft.

Yderligere har man forbedret muligheden for at kunne lukke ned for dele af processoren når disse ikke skal bruges. Som en del af Intel’s Smart Cache har Intel implementeret at processoren kan lukke sin cache helt ned – simpelthen ved at flushe data’en – og synke til et endnu lavere energiniveau. Når der igen er brug for databehandling, som kræver cache, så startes den dynamisk op igen og processoren går tilbage i sit normale energiniveau. Denne feature så man allerede på Yonah-processoren, men nu finder den vej til Core 2 også.

Ydermere er Core 2 processoren delt ind i mange mindre områder end eksempelvis Pentium 4 var. Disse mindre dele kan derfor oftere lukkes ned, hvis der ikke er brug for dem og det giver igen et lavere effektforbrug.

En pudsig detalje omkring dette er at Intel dermed har fået svært ved at angive processorens temperatur. Undervejs i udviklingen fandt man simpelthen ud af at processortemperaturen kunne variere meget imellem de forskellige områder, hvorfor en almindelig løsning med en enkelt temperaturdiode ikke altid ville give et præcist billede af processorens temperatur. Derfor har man i Core 2 processorerne placeret flere dioder rundt i processoren og når man checker temperaturen på sin Core 2 processor er det faktisk et gennemsnit af disse forskellige værdier, som man aflæser.


Tak til Klaus S for disse ord
DEVIL_DK
 
Elitebruger
Tilføjet:
13-01-2007 11:23:26
Svar/Indlæg:
6531/410
Fed test det viser jo noget om at de store dyre cpuer ikke altid er det bedste køb.

jeg har selv en E6600 og ocer ikke derfor valgte jeg den.
da en uocét e6300 imo er lige sløv nok til mit 3dkort.



jmose
 
Moderator
Tilføjet:
13-01-2007 11:47:49
Svar/Indlæg:
3863/538
Samme her.

Er ikke den store OC´er - så har også valgt en E6600. Og skulle jeg få brug for mere power - tænker jeg ikke at den har store problemer med at nå 3 Ghz ;)

Sidder dog i tanker vedr. opgradering af ungernes pc´ere, og er/var lidt spændt på om det skulle være det ene eller det andet.
(eller om det skulle være E4300)



Psym
 
Overclocker
Tilføjet:
13-01-2007 11:56:00
Svar/Indlæg:
663/58
min e6600 køre 3.2 ghz pt på gigabye-d3 uden nogle problemer. siden jeg fik samlet skidtet i går har der samlet sig en sø af savl foran min pc... ^_^ elsker mit nye rig



allan_84
 
Elitebruger
Tilføjet:
13-01-2007 12:10:37
Svar/Indlæg:
765/82
hmm læser testen,, men nogle ting stoppper jeg over.

Alle Core 2 Duo processor er bygget over den samme kerne, og derfor
hmmm de hedder da allendal og conroe, såå nej..

og den her

står der ikke "X6800" på CPU'en, men "Intel Confidential". Det skyldes, at det drejer sig om den Engenering Sample, vi fik til

et pre release altså, kan man teste og bruge den til sammenligning så?



Emillos
 
Overclocker
Tilføjet:
13-01-2007 12:14:08
Svar/Indlæg:
14079/622
->#4

Det er de altså..
Dem der kaldes "Allendale", har fysisk 4MB cache. Den er bare deaktiveret. :)

Og selvfølgelig kan man bruge en ES til noget - tvivler på at en nyere CPU havde nået højere op i dette tilfælde.
Men det ville selvfølgelig være mest optimalt med processorer af samme oprindelse, eller hvad man nu siger. :)



Jesper
 
Elitebruger
Tilføjet:
13-01-2007 12:20:09
Svar/Indlæg:
2072/117
Takker meget for denne test...

Står netop over for dette valg som tester bygger på...

Er begyndt at overveje at bruge nogle flere penge på ram og så OC den....

Men tror stadig jeg vælger E6600



beatmore
 
Elitebruger
Tilføjet:
13-01-2007 13:15:35
Svar/Indlæg:
3943/44
De er alle conroes, e4000 serien med 800mhz fsb er Allendale.
Og den er lavet på en anden kerne (sikkert temmelig ens) men den clocker altså ikke så langt op som de andre.

Det med at de små conroes er Allendale er noget vås fra den gang folk hørte at der kom en mindre version. Selv CPU-Z siger at de er allendale.

Men en ting er helt sikkert e6330 bliver nok en succes, e6300 med 4mb cache. - i andet kvartal i år erstatter den e6300 - i hvert fald skulle prisen blive den samme.

Tror da også at de rigtige allendales bliver noget ved, i hvert fald når prisen først falder i andet kvartal, indtil da tror jeg at prisen er for tæt på e6300.
http://hwt.dk/news.asp?id=1319...

Men en god og informativ artikel.



beatmore
 
Elitebruger
Tilføjet:
13-01-2007 13:18:41
Svar/Indlæg:
3943/44
Hov den hedder e6320.

Af en eller anden årsag er det forrige indlæg ikke på min liste under community.



Lars
 
Elitebruger
Tilføjet:
13-01-2007 13:51:35
Svar/Indlæg:
3712/44
Fin lille sammenligning med en rimeligt forudsigelig konklusion ;)

Jeg vil dog helt klart give #4 ret i at det ikke helt er "æbler til æbler" sammenligning når der er tale om forskellige steppings. På den anden side vil der også være en del forskel på hvordan tilfældigt udvalgte retail cpu'er clocker.

Generelt clocker cpu'erne dog bedre og bedre jo længere hen i produktionsprocessen man er kommet, så en nyere cpu vil clock bedre. ES B1'erne viste også en meget lav temp i forhold til retail B2'erne, A1'erne viste en meget højere temp.

Min E6700 B2 (retail) clocker langt bedre end nogen af mine 2x 6800ES B0 chips gjorde.

IMO er konklusionen i artiklen rimeligt i orden. Men det er helt klart et must at benytte et bundkort der virkelig kan oc på fsb, for dem der sidder med et 975 chipset og vandkøling vil IMO helt klart være bedst tjent med en E6600, også i forhold til prisen





MortenSlott
 
Overclocker
Tilføjet:
13-01-2007 14:47:50
Svar/Indlæg:
23/8
ved ikke om det bare er mig, men syntes nu stadig at det er svært at vælge om man vil bruge 1 K mere eller mindre på noget som, sådan som jeg ser det, ser rimeligt ens ud i ydelse når man har overclocket dem, er det ikke en bedre idé at bruge de ekstra 1000 kr til et MOBO som kan levere en høj fsb, så ville e6300 da komme op på e6600 niveu uden problemer, eller hva?



MortenSlott
 
Overclocker
Tilføjet:
13-01-2007 14:49:55
Svar/Indlæg:
23/8
+ at man endda får en lavere temp. ved e6300, og som mange siger så har cachen ingen praktisk betydning



Woodgnome
 
Elitebruger
Tilføjet:
13-01-2007 17:03:15
Svar/Indlæg:
1888/560
#11 cache har da i særdeleshed stor betydning - størrelsen af den har måske ikke ;).



MortenSlott
 
Overclocker
Tilføjet:
13-01-2007 18:53:04
Svar/Indlæg:
23/8
hehe.. det var min fejl :r
det var selvfølgelig størrelsen jeg mente :p
tak for rettelsen :00



Stensgaard
 
Elitebruger
Tilføjet:
13-01-2007 20:00:57
Svar/Indlæg:
2620/327
#9 Du har selvfølgelig ret (og tak for ekstra info :)) - grunden til, at den X6800 er med i testen, er først og fremmest den, at vi havde den liggende. Testen er mest tænkt som en kamp mellem E6300 og E6600 - og så kunne vi for sjov også tage den X6800 med ;)

Ang. bundkort, så vil jeg nu også mene, at for mange "almindelige" bruger vil E6300 være fin nok - mange bundkort vil uden problemer kunne få den op 2,8-3GHz, og ved den hastighed kører den rigtig godt, og er meget nem at køle.

Men jeg har da selv valgt at købe en E6600 8)



Martin.v.R
 
Elitebruger
Tilføjet:
13-01-2007 20:24:44
Svar/Indlæg:
8555/439
:l jeg blivere lidt konfus,af den test :e
skal jeg forstå det,sådan at laver multipli..+ høj FSB er best ?:(
lige nu køre jeg 400x9 men skal jeg havde fsben op på 500 bliver det med multi..6,men det gir kun 3.0MHZ mod min 3.6GHZ nu



Stensgaard
 
Elitebruger
Tilføjet:
13-01-2007 21:34:04
Svar/Indlæg:
2620/327
#15 Hvis du nu fx kører 450x8, bliver det også 3,6GHz, og det vil være lidt hurtigere end 400x9.



Martin.v.R
 
Elitebruger
Tilføjet:
13-01-2007 21:50:47
Svar/Indlæg:
8555/439
#15
jeg har prøvet ,men det gir ikke noget ;) JO 20p mere i 3D-mark06
men det sjove er at min cpu er mere stabil ved multip..8 når jeg kommer over 423 FSB :l
den er stabil ved 475x8=3.8GHZ MEN MEN man taber for meget på båndbreden på ram her :l så 400x9 vinder stadig ;) over 3.8GHZ med multip..8



Martin.v.R
 
Elitebruger
Tilføjet:
13-01-2007 22:03:38
Svar/Indlæg:
8555/439
fejl på siden igen :l
nå men #15 skulle havde været til 16/Stensgaard



Stensgaard
 
Elitebruger
Tilføjet:
13-01-2007 23:28:29
Svar/Indlæg:
2620/327
#17 Nå ja, hvis du bruger P965 chipset, sætter den timings ned, når du kommer over 400MHz FSB.
Min test viste nu alligevel en større båndbredde ved 464x7 end ved 360x9 - men der er så også over 100MHz forskel i FSB, hvilket åbenbart er nok til, at de lavere timings ikke betyder så meget....



Martin.v.R
 
Elitebruger
Tilføjet:
14-01-2007 02:46:33
Svar/Indlæg:
8555/439
nå :l men ellers fin test,en extra god grund til¨,at være glad for sin E6600 :)



Kirsby
 
Superbruger
Tilføjet:
14-01-2007 12:09:04
Svar/Indlæg:
1214/62
Er skam glad nok for min E-6400



#22
Lars
 
Elitebruger
Tilføjet:
14-01-2007 13:59:19
Svar/Indlæg:
3712/44
#14 > Det er også fint nok at du har taget X6800 med i testen. En nyere version ville på ingen måde have påvirket udfaldet af duellen på pris/performance.

Mht. bundkort delen er vi faktisk heller ikke uenige, i praksis vil langt de fleste, som anvender lukkede kabinetter, måske endda ekstra støj isolerede etc, være bedst tjent med at holde deres lufkølede overclockede core 2 duo's "nede" på en 3.2-3.3 Ghz På den måde kan man nøjes med stort set standard Vcore og noget mindre varme.

Min E6700 som kørte 4.5 GHz i Mach'en stabilt (max over 4.7 GHz) kører nu 3.33 GHz ved standard Vcore i juniors system, og den er rigeligt hurtig til at spille på. Den sidder netop i et totalt lydisoleret kabinet med meget få blæsere, og ligger på en meget fornuftig temperatur. En E6300 havde i praksis nok kunnet clockes til næsten det samme, måske med en smule mere Vcore, og havde dermed i praksis været lige så hurtig.

Den havde jeg bare aldrig fået op på 4.5 GHz i Mach'en på et 975X bundkort... ;)

I øvrigt er core 2 duo ikke voldsomt afhængig af en høj fsb eller hurtige ram i de fleste applikationer. I nogle enkelte kan man se forskel (superpi 32M f.eks.), men der er som udgangspunkt ikke meget andet end stabilitetsproblemer at hente over 400 Mhz fsb på langt de fleste bundkort. Pga. timings i chipsettet på 975X er ret meget over 420-430 Mhz bare ikke stabilt, og på 965 bliver chipset timings så meget lavere over 400 Mhz (og lavere igen et par gange deropad) at der stort set intet er at hente i ydelse ved at køre en høj fsb.

De artikler jeg har set hvor man har testet en bred vifte af programmer på core 2 duo med hhv 2 og 4 MB cache, har den største forskel været på 10% ydelse, og i snit mener jeg der var omkring en 4-6%. Så kan man finde et bundkort der kan klare 400 Mhz fsb uden problemer og måske lidt til, så er der da helt klart mest "bang for the buck" i en E6300. Det "sikre" valg er så en E6600, for selv om man har et bundkort der ikke lige clocker vildt godt eller nogle ram der ikke kan følge med, så kan man næsten altid clocke den til mindst 3 GHz, og så er man allerede godt kørende.



_-Q-_
 
Overclocker
Tilføjet:
15-01-2007 16:52:45
Svar/Indlæg:
171/9
En skam at T-modellerne af C2D ikke er med i testen.



ZnarF
 
Elitebruger
Tilføjet:
15-01-2007 22:44:34
Svar/Indlæg:
1058/59
Super test :D - nød at læse den fra ende til anden... også selv om resultatet var til at gætte på forhånd... tror mit næste system bliver E6600 :00



Fakker
 
Overclocker
Tilføjet:
17-01-2007 13:54:34
Svar/Indlæg:
126/6
Rigtig gode test i laver herinde. Har brugt det meget ang køb af hardware ;) Ang den her holder jeg mig stadig fast ved E6600. Synes klart det er det bedste køb



Martin.v.R
 
Elitebruger
Tilføjet:
17-01-2007 14:35:01
Svar/Indlæg:
8555/439
der er bare en ting,som jeg ikke rigtig kan blive klog på ?:(
min gammel dual 920,gav en beder/højre fps i spil ?:( er det fordig E6600 ikke rigtig kan udnytte ramne ?:(

dual 920@ 3.6GHZ havde 85/90 i fps i spillet America's Army
hvor min E6600@ 3.6GHZ max har 75/80 fps :l
der er brugt det samme GFX,mit 7900GTO ;)

mange siger at,hvis man skal havde gode ram til ens cpu ved 400x9 skal kunne køre 2:3 eller 3:5 og ikke 1:1? hvis man læsere længe nok på Google.


ASUS chip/bios laver også noget,sjovt ved 400x9
se her
400x9 1:1 cas 4-4-4-12=PC4300 :l
400X9 !:1 cas 3-3-3-9 =PC6400 ?:( hva sker der lige her ?:(



Martin.v.R
 
Elitebruger
Tilføjet:
17-01-2007 14:38:36
Svar/Indlæg:
8555/439
langsom side ####
skulle havde været med i #26
ASUS/bios 965



Jesper
 
Elitebruger
Tilføjet:
17-01-2007 14:52:29
Svar/Indlæg:
2072/117
Hvilken CPU af E6600 og E6300 udvikler egentlig mest varme ved 3Ghz?



Martin.v.R
 
Elitebruger
Tilføjet:
17-01-2007 14:57:13
Svar/Indlæg:
8555/439
nok E6600



Stensgaard
 
Elitebruger
Tilføjet:
17-01-2007 19:39:59
Svar/Indlæg:
2620/327
#28 Det gør E6600



Advanced
 
Elitebruger
Tilføjet:
17-01-2007 19:56:30
Svar/Indlæg:
6899/119
#28

E6600 pga dobbelt cache.





Jesper
 
Elitebruger
Tilføjet:
18-01-2007 23:01:46
Svar/Indlæg:
2072/117
E6300 til mig :e



Fritsen
 
Superbruger
Tilføjet:
01-03-2007 23:36:48
Svar/Indlæg:
37/2
Kunne være rigtigt interessant at se, hvordan E4300 ville klare sig...
Den kunne jog f.eks. sagtens finde på at købe, pga. den høje multip på 9, og den lave pris... :)