Test: Intel Q9300 2.5GHz

CPU, Intel d.  05. juli. 2008, skrevet af Polarfar 14 Kommentarer.  Vist: 19499 gange.

Korrekturlæser: 
Billed behandling: 
Oversættelse: 

Pristjek på http://www.pricerunner.dk 
Produkt udlånt af: Intel
DK distributør: Tech Data

Teknologi - Core 2 Quad

 

Nu hedder det jo godt nok quadcore, altså en fir-kerne processor. Men hvis vi skræller låget af og kigger på den fysiske opbygning, så er det nok mere korrekt at kalde det for en dual-dualcore. Simpelt sagt er Q9300 2 styks E7X00 Wolfdale (333fsb) - på ét PCB, der kommunikerer over FrontSideBus'en, akkurat ligesom en maskine med 2 separate processorer på et bundkort gør. Eller på samme måde som Pentium D gjorde med 2 singlecores. Men siden Pentium D er FSB'en er blevet så hurtig, at de 2 kerner kan dele cachen indbyrdes udenom FSB'en, og så er denne "falske" quadcore løsning slet ikke så ringe endda. Her er FSB'en så hævet til 333MHz så vi lander på 2.5GHz.

 

          

Her ses forskellen på henholdsvis Kentsfield(Core2Quad - tv.) og Conroe(Core2Duo - th.)

Grunden til at Intel har valgt at lave deres quadcores på denne måde, skyldes højest sandsynligt at chippen ellers ville være for kompleks. AMD, der er ved at udvikle de første ægte quadcore, har i øjeblikket store problemer med at få deres nye serie af processorer til at virke ordenligt. Alligevel har Intel planer om at lancere ægte quadcores, men først når teknologien er moden til det.

Siden Core 2 Quad i bund og grund består af 2 sammenklistrede Core 2 Duo, understøtter den naturligvis også de gængse teknologier som sidstnævnte, herunder Enhanced Intel Speedstep (EIST) der underclocker og undervolter processorkernerne når de ikke bliver belastet ret meget, samt SSSE3-instruktioner der giver forbedret ydelse i visse applikationer. Lad os tage en uddybning af alle teknologierne, og en forklaring af Core2's design...

Højere IPC – Flere instruktioner på samme tid

Med Core 2 har Intel valgt et design, der i langt højere grad end før fokuserer på en høj IPC. Dette er der flere grunde til, men at være mindre afhængig af clockfrekvensen har en række klare fordele.

Dels stiller det mindre krav til hvor høje ”trin” der skal være imellem de clockfrekvenser man tilbyder. Et spring i clockfrekvens på eksempelvis 200Mhz kan sagtens forsvares fordi ydelsesforskellen er til at få øje på. Dette betyder dels noget for slutbrugerne, men på det professionelle marked kan dette være rigtig fornuftigt fordi man kan få kunderne til løbende at opgradere til nyeste processorer fordi de kan mærke en reel forbedring i ydelsen. AMD har med stor succes gjort dette med Opteron-processoren, som på 2½ år er gået fra max 2GHz clockfrekvens til max 2.8GHz for hurtigste model. Ikke ligefrem et kvantespring, men trinene har været store nok til at folk har fundet det rimeligt at opgradere.

En anden fordel ved at være mindre afhængig af clockfrekvensen finder man i den anden ende af skalaen. Intel fik med Pentium M processoren vist at SpeedStep – hvor man dynamisk ændrer clockfrekvensen og processorspændingen efter behovet for regnekraft – havde enormt potentiale. AMD tog dette op med Cool’n’Quiet i deres K8 processorer og for begge arkitekturer gjaldt det at man selv ved lav clockfrekvens havde en fair ydelse – ene og alene fordi IPC’en var høj.

Dette er endnu en grund til at den høje IPC bør være vinder, men hvordan har Intel så grebet sagen an? Dels har man valgt en noget reduceret pipeline, som er på 14 stages. En kort pipeline er dog i sig selv ikke alene nok til at give mere effektivitet, så Intel har tilført Wide Dynamic Execution. ”Almindelig” Dynamic Execution handler om at snyde processoren til at se en række instruktioner som én stor instruktion og derfor tage disse samlet og i rækkefølge. Grunden til at Dynamic Execution nu er blevet ”Wide” er at Intel i Core 2 arkitekturen har tilføjet en ny decoder og execution unit, så processoren nu kan håndtere fire x86 instruktioner samtidigt. Både Intel’s tidligere og AMD’s nuværende processorer kan maksimalt køre 3 x86 instruktioner samtidigt. Man får altså ikke bare en kortere pipeline, men også en bredere pipeline, som yderligere hæver IPC’en.

 



Mere cache

Dertil har man øget mængden af L1 cache i forhold til Pentium 4. Core 2 processorerne har fået 64KB L1 cache, hvilket er fordelt ligeligt imellem data og instruktion. Dette er langt mere L1 cache end i Pentium 4 arkitekturen, der grundlæggende havde 8KB L1 cache til data og 12KB til instruktion. Da Intel skiftede fra Northwood til Prescott blev mængden af cache til data fordoblet fra 8KB til 16KB, men Core processorerne har altså mere end det dobbelte.

Du kan finde Core 2 cpu'er med alt fra 512kb op til 6MB cache men da der er tale om dual-core processorer vil L2 cache’en blive delt imellem de to CPU kerner. Dette sker fordi Intel har implementeret deres Smart Cache. Med den kan man dynamisk allokere cache-mængde til hver enkelt processorkerne. Kører man således en applikation, som kun kan udnytte den ene processor, vil denne ene processor få den fulde mængde cache til sin rådighed.

Dette er på papiret smart, men som man hurtigt vil se så er denne feature meget lidt værd i praksis – en dual-core processor vil nemlig næsten altid bruge begge cores i større eller mindre grad fordi operativsystemet (og flere andre underliggende applikationer) bruger CPU-tid. Derfor har Intel med deres Smart Cache implementeret en Crossbar-funktion, som dynamisk deler cache-mængden imellem de to processorkerner.

Udover denne glimrende funktion har Intel gjort en del for at pre-fetche data til cache’en endnu bedre end før. Dels er selve pre-fetch algoritmen optimeret, men en ny feature går ud på at hvis processor-kerne 1 skal bruge data som ligger i cache’en hos processor-kerne 2, så kan processor-kerne 1 tage den databid direkte. Tidligere ville man i dette tilfælde skulle have data’en ud af processor-kerne 2’s cache og ind i processoren igen, hvilket gav høj latency.

 



Men ikke kun data til cache pre-fetches bedre. Intel Smart Memory Access dækker over en generelt forbedret pre-fetch del i processoren. For x86 kode gælder det normalt at cirka 20 procent af instruktionerne kræver adgang til hukommelsen og her er netop prefetch-delen vigtig. Core 2 processorerne har her seks uafhængige pre-fetch enheder, der alle har en forbedret algoritme til at ramme præcis den data som processoren skal bruge. Dertil har Smart Memory Access fået en ny feature, som tillader at en ny instruktion kan startes selvom den er afhængig af resultatet af en tidligere instruktion – dette minimerer out-of-order, hvor en instruktion ellers må bremses fordi der ventes på data.

EM64T, SSE, osv.

En anden stor forbedring i Core 2 arkitekturen er at 64-bit understøttelsen er på plads i alle processorer. Intel benytter fortsat sin egen EM64T (Enhanced Memory 64 Technology) til at varetage 64-bit delen, men som Intel’s markedsføring tegner sig vil det primært blive på server-området at man vil slå på EM64T. Dette giver såmænd også ganske god mening, da der mangler langt bedre software-understøttelse for at 64-bit kan blive en succes på desktoppen.

SSE instruktionssættet vil også blive forbedret i Core 2 arkitekturen. Således vil alle 128-bit SSE instruktioner nu kunne beregnes på en enkelt clockcyklus – tidligere krævede dette to af slagsen. Da SSE-instruktioner oftest benyttes ved multimedia kalder Intel denne nye feature for Intel Advanced Digital Media Boost.

 



SSE4 finder også vej til Core 2 – Pentium 4 processorerne havde SSE, SSE2 og SSE3, men nu kommer der yderligere 8 instruktioner, som samles under SSE4 betegnelsen. Disse var tidligere tiltænkt Tejas-processoren, som Intel droppede til fordel for netop Core arkitekturen. Derfor blev disse også tidligere kaldt TNI (Tejas New Instructions), men er nu en del af SSE3.

NX (No eXecutable) Bit vil uændret finde vej til Core 2 og dermed tilbyde samme beskyttelse overfor skadelig kode, som Intel fik introduceret i sine seneste Pentium processorer. Også Intel’s VT (Virtualization Technology) vil være standard i Core 2 processorerne, der igen overtager disse teknologier uforandrede fra de seneste Pentium processorer.

Lavere strømforbrug

Strømforbruget har været en særdeles vigtig faktor i udviklingen af Core 2 arkitekturen og det har betydet at Intel yderligere har arbejdet på at sænke dette. Dels benytter man deres Enhanced SpeedStep, som tilpasser processorens clockfrekvens – og dertil også processorspændingen – til behovet for regnekraft.

Yderligere har man forbedret muligheden for at kunne lukke ned for dele af processoren når disse ikke skal bruges. Som en del af Intel’s Smart Cache har Intel implementeret at processoren kan lukke sin cache helt ned – simpelthen ved at flushe data’en – og synke til et endnu lavere energiniveau. Når der igen er brug for databehandling, som kræver cache, så startes den dynamisk op igen og processoren går tilbage i sit normale energiniveau. Denne feature så man allerede på Yonah-processoren, men nu finder den vej til Core 2 også.

Ydermere er Core 2 processoren delt ind i mange mindre områder end eksempelvis Pentium 4 var. Disse mindre dele kan derfor oftere lukkes ned, hvis der ikke er brug for dem og det giver igen et lavere effektforbrug.

En pudsig detalje omkring dette er at Intel dermed har fået svært ved at angive processorens temperatur. Undervejs i udviklingen fandt man simpelthen ud af at processortemperaturen kunne variere meget imellem de forskellige områder, hvorfor en almindelig løsning med en enkelt temperaturdiode ikke altid ville give et præcist billede af processorens temperatur. Derfor har man i Core 2 processorerne placeret flere dioder rundt i processoren og når man checker temperaturen på sin Core 2 processor er det faktisk et gennemsnit af disse forskellige værdier, som man aflæser.

 

Satai
 
Overclocker
Tilføjet:
05-07-2008 10:03:10
Svar/Indlæg:
700/28
Godt alternativ til Q6600 Med mere OC potentiale 😀 😀

God test 😀


hamderD
 
Elitebruger
Tilføjet:
05-07-2008 11:22:51
Svar/Indlæg:
7263/260
God test 🙂 - Lækker cpu faktisk.


Kasseren
 
Elitebruger
Tilføjet:
05-07-2008 11:43:31
Svar/Indlæg:
1814/48
Spørgsmålet er blot om AMDs Phenom x4 9750 og 9850 ikke stadig er det bedste valg for pengene i den prisklasse.


MadsAG
 
Elitebruger
Tilføjet:
05-07-2008 12:20:54
Svar/Indlæg:
5421/53
#3 Well..

Nej, ikke i mit tilfælde 😛, Jeg skal ikke ligge og rode rundt med Hotfixes hele tiden..


Polarfar
 
Senior Skribent
Tilføjet:
05-07-2008 12:30:53
Svar/Indlæg:
2309/846
INGEN FLAMEWARS TAK ! 😎

mvh. admins


Gripen90
 
Senior Skribent
Tilføjet:
05-07-2008 14:12:37
Svar/Indlæg:
15982/637
#3: njarh så vidt jeg har set er X4 9750 og 9850 lige knap i samme ydelses kategori som Q9300, men tæt på. Jeg er dog sikker på bang for the buck mæssigt er Q9300 bedst.

#4: Der skal ikke bruges hotfix 🤡


#7
CF
 
Elitebruger
Tilføjet:
05-07-2008 16:24:31
Svar/Indlæg:
4689/105
Jeg ville stadig tage den her frem for AMD. Den kan OC længere op end deres. Men for en normal PC-bruger der ikke skal OC, så er AMD et fint valg i den her prisklasse.

Dog ville jeg så stadig vælge Intel hvis jeg skulle samle for andre. Det ved jeg hvordan virker, og jeg føler mig mere sikker med Intel.


CoolerX
 
Overclocker
Tilføjet:
06-07-2008 21:01:28
Svar/Indlæg:
34/0
Måske et dumt ?, men brugte du standard køleren til at opnå dit 51% overclock..?

Ellers fin test


Polarfar
 
Senior Skribent
Tilføjet:
07-07-2008 07:00:14
Svar/Indlæg:
2309/846
#8 Nej, vandkøling


#10
Qax
 
Superbruger
Tilføjet:
07-07-2008 22:36:49
Svar/Indlæg:
12/0
#8 ville jeg ellers også spørge om.
Sidder med et GA-EP35-DS4 og en E8400 med Cossair Dominator 2x2gb PC8500, som nok skulle have en OC tur snart.

Men mangler en ekstremt grundig forklaring på hvad der er hvad inde i Bios.

Det tog mig nemlig en evighed at finde ud af at HT link skulle sættes ned til 4x på min AMD64, før den ville noget som helst.


Polarfar
 
Senior Skribent
Tilføjet:
08-07-2008 16:32:35
Svar/Indlæg:
2309/846
du får ingen HT link problemer på et Intel board. Det er en AMD ting.


#12
Qax
 
Superbruger
Tilføjet:
08-07-2008 17:34:53
Svar/Indlæg:
12/0
ved jeg da godt... det var bare et eksempel.


Claus35
 
Elitebruger
Tilføjet:
14-07-2008 10:34:54
Svar/Indlæg:
5410/123
#12 Opret en tråd i forumet, så kan vi hjælpe der 🙂


Iridium
 
Overclocker
Tilføjet:
15-07-2008 17:04:07
Svar/Indlæg:
1/0
........Ikke ligefrem et kvantespring, men trinene har været store nok til at folk har fundet det rimeligt at opgradere.

> Mener du ikke, at IPC er stor nok for et givent MHz-spring?

Ellers har jeg lidt svært ved at se logikken. MHz-trinnene kan jo for så vidt gøres vilkårligt store (indenfor teknologiens grænser), så det alene af den grund kan være en fordel; men det er jo slet ikke pointen jvf. afsnittets overskrift ang. højere IPC!

Mvh.