Test: Intel QX9650 Yorkfield

CPU, Intel d.  22. december. 2007, skrevet af Polarfar 29 Kommentarer.  Vist: 16934 gange.

Korrekturlæser: 
Billed behandling: 
Oversættelse: 

Pristjek på http://www.pricerunner.dk 
Produkt udlånt af: Intel
DK distributør: Tech Data

Teknologi - Core 2 Quad

 

Nu hedder det jo godt nok quadcore, altså en fir-kerne processor. Men hvis vi skræller låget af og kigger på den fysiske opbygning, så er det nok mere korrekt at kalde det for en dual-dualcore. Simpelt sagt er QX9650 2 styks E8400 - måske bedre kendt som den kommende 3.0GHz Wolfdale - på ét PCB, der kommunikerer over FrontSideBus'en. Akkurat ligesom en maskine med 2 seperate processorer på et bundkort gør. Eller på samme måde som Pentium D gjorde med 2 singlecores. Men siden pentium D er FSB'en er blevet så hurtig at de 2 kerner kan dele cachen indbyrdes udenom FSB'en, og så er denne "falske" quadcore løsning slet ikke så ringe endda.

 

          

Her ses forskellen på henholdsvis Kentsfield(Core2Quad - tv.) og Conroe(Core2Duo - th.)

Grunden til at Intel har valgt at lave deres quadcores på denne måde, skyldes højest sandsynligt at chippen ellers ville være for kompleks. AMD, der er ved at udvikle de første ægte quadcore, har i øjeblikket store problemer med at få deres nye serie af processorer til at virke ordenligt. Alligevel har Intel planer om at lancere ægte quadcores, men først når teknologien er moden til det.

Siden Core2Quad i bund og grund består af 2 sammenklistrede Core 2 Duo, understøtter den naturligvis også de gængse teknologier som sidstnævnte. Herunder Enhanced Intel Speedstep(EIST) der underclocker og undervolter processorkernerne når de ikke bliver belastet ret meget, samt SSSE3-instruktioner der giver forbedret ydelse i visse applikationer. Lad os tage en uddybning af alle teknologierne, og en forklaring af Core2's design...

Højere IPC – Flere instruktioner på samme tid

Med Core 2 har Intel valgt et design, der i langt højere grad end før fokuserer på en høj IPC. Dette er der flere grunde til, men at være mindre afhængig af clockfrekvensen har en række klare fordele.

Dels stiller det mindre krav til hvor høje ”trin” der skal være imellem de clockfrekvenser man tilbyder. Et spring i clockfrekvens på eksempelvis 200Mhz kan sagtens forsvares fordi ydelsesforskellen er til at øje på. Dette betyder dels noget for slutbrugerne, men på det professionelle marked kan dette være rigtig fornuftigt fordi man få kunderne til løbende at opgradere til nyeste processorer fordi de kan mærke en reel forbedring i ydelsen. AMD har med stor succes gjort dette med Opteron-processoren, som på 2½ år er gået fra max 2GHz clockfrekvens til max 2.8GHz for hurtigste model. Ikke ligefrem et kvantespring, men trinene har været store nok til at folk har fundet det rimeligt at opgradere.

En anden fordel ved at være mindre afhængig af clockfrekvensen finder man i den anden ende af skalaen. Intel fik med Pentium M processoren vist at SpeedStep – hvor man dynamisk ændrer clockfrekvensen og processorspændingen efter behovet for regnekraft – havde enormt potentiale. AMD tog dette op med Cool’n’Quiet i deres K8 processorer og for begge arkitekturer gjaldt det at man selv ved lav clockfrekvens havde en fair ydelse – ene og alene fordi IPC’en var høj.

Dette er endnu en grund til at den høje IPC bør være vinder, men hvordan har Intel så grebet sagen an? Dels har man valgt en noget reduceret pipeline, som er på 14 stages. En kort pipeline er dog i så selv ikke alene nok til at give mere effektivitet, så Intel har tilført Wide Dynamic Execution. ”Almindelig” Dynamic Execution handler om at snyde processoren til at se en række instruktioner som én stor instruktion og derfor tage disse samlet og i rækkefølge. Grunden til at Dynamic Execution nu er blevet ”Wide” er at Intel i Core 2 arkitekturen har tilføjet en ny decoder og execution unit, så processoren nu kan håndtere fire x86 instruktioner samtidigt. Både Intel’s tidligere og AMD’s nuværende processorer kan maksimalt køre 3 x86 instruktioner samtidigt. Man får altså ikke bare en kortere pipeline, men også en bredere pipeline, som yderligere hæver IPC’en.

Mere cache

Dertil har man øget mængden af L1 cache i forhold til Pentium 4. Core 2 processorerne har fået 64KB L1 cache, hvilket er fordelt ligeligt imellem data og instruktion. Dette er langt mere L1 cache end i Pentium 4 arkitekturen, der grundlæggende havde 8KB L1 cache til data og 12KB til instruktion. Da Intel skiftede fra Northwood til Prescott blev mængden af cache til data fordoblet fra 8KB til 16KB, men Core processorerne har altså mere end det dobbelte.

L2 cache bliver på enten 2MB eller 4MB afhængigt af model, men da der er tale om dual-core processorer vil L2 cache’en blive delt imellem de to CPU kerner. Dette sker fordi Intel har implementeret deres Smart Cache. Med den kan man dynamisk allokere cache-mængde til hver enkelt processorkerne. Kører man således en applikation, som kun kan udnytte den ene processor vil denne ene processor få den fulde mængde cache til sin rådighed.

Dette er på papiret smart, men som man hurtigt vil se så er denne feature meget lidt værd i praksis – en dual-core processor vil nemlig næsten altid bruge begge cores i større eller mindre grad fordi operativsystemet (og flere andre underliggende applikationer) bruger CPU-tid. Derfor har Intel med deres Smart Cache implementeret en Crossbar funktion, som dynamisk deler cache-mængden imellem de to processorkerner.

Udover denne glimrende funktion har Intel gjort en del for at pre-fetche data til cache’en endnu bedre end før. Dels er selve pre-fetch algoritmen optimeret, men en ny feature går ud på at hvis processor-kerne 1 skal bruge data som ligger i cache’en hos processor-kerne 2, så kan processor-kerne 1 tage den databid direkte. Tidligere ville man i dette tilfælde skulle have data’en ud af processor-kerne 2’s cache og ind i processoren igen, hvilket gav høj latency.

 



Men ikke kun data til cache pre-fetches bedre. Intel Smart Memory Access dækker over en generelt forbedret pre-fetch del i processoren. For x86 kode gælder det normalt at cirka 20 procent af instruktionerne kræver adgang til hukommelsen og her er netop prefetch-delen vigtig. Core 2 processorerne har her seks uafhængige pre-fetch enheder, der alle har en forbedret algoritme til at ramme præcis den data som processoren skal bruge. Dertil har Smart Memory Access fået en ny feature, som tillader at en ny instruktion kan startes selvom den er afhængig af resultatet af en tidligere instruktion – dette minimerer out-of-order, hvor en instruktion ellers må bremses fordi der ventes på data.

EM64T, SSE, osv.

En anden stor forbedring i Core 2 arkitekturen er at 64-bit understøttelsen er på plads i alle processorer. Intel benytter fortsat sin egen EM64T (Enhanced Memory 64 Technology) til at varetage 64-bit delen, men som Intel’s markedsføring tegner sig vil det primært blive på server-området at man vil slå på EM64T. Dette giver såmænd også ganske god mening, da der mangler langt bedre softwareunderstøttelse for at 64-bit kan blive en succes på desktoppen.

SSE instruktionssættet vil også blive forbedret i Core 2 arkitekturen. Således vil alle 128-bit SSE instruktioner nu kunne beregnes på en enkelt clockcyklus – tidligere krævede dette to af slagsen. Da SSE instruktioner oftest benyttes ved multimedia kalder Intel denne nye feature for Intel Advanced Digital Media Boost.

 



SSE4 finder også vej til Core 2 – Pentium 4 processorerne havde SSE, SSE2 og SSE3, men nu kommer der yderligere 8 instruktioner, som samles under SSE4 betegnelsen. Disse var tidligere tiltænkt Tejas-processoren, som Intel droppede til fordel for netop Core arkitekturen. Derfor blev disse også tidligere kaldt TNI (Tejas New Instructions), men er nu en del af SSE3.

NX (No eXecutable) Bit vil uændret finde vej til Core 2 og dermed tilbyde samme beskyttelse overfor skadelig kode, som Intel fik introduceret i sine seneste Pentium processorer. Også Intel’s VT (Virtualization Technology) vil være standard i Core 2 processorerne, der igen overtager disse teknologier uforandrede fra de seneste Pentium processorer.

Lavere strømforbrug

Strømforbruget har været en særdeles vigtig faktor i udviklingen af Core 2 arkitekturen og det har betydet at Intel yderligere har arbejdet på at sænke dette. Dels benytter man deres Enhanced SpeedStep, som tilpasser processorens clockfrekvens – og dertil også processorspændingen – til behovet for regnekraft.

Yderligere har man forbedret muligheden for at kunne lukke ned for dele af processoren når disse ikke skal bruges. Som en del af Intel’s Smart Cache har Intel implementeret at processoren kan lukke sin cache helt ned – simpelthen ved at flushe data’en – og synke til et endnu lavere energiniveau. Når der igen er brug for databehandling, som kræver cache, så startes den dynamisk op igen og processoren går tilbage i sit normale energiniveau. Denne feature så man allerede på Yonah-processoren, men nu finder den vej til Core 2 også.

Ydermere er Core 2 processoren delt ind i mange mindre områder end eksempelvis Pentium 4 var. Disse mindre dele kan derfor oftere lukkes ned, hvis der ikke er brug for dem og det giver igen et lavere effektforbrug.

En pudsig detalje omkring dette er at Intel dermed har fået svært ved at angive processorens temperatur. Undervejs i udviklingen fandt man simpelthen ud af at processortemperaturen kunne variere meget imellem de forskellige områder, hvorfor en almindelig løsning med en enkelt temperaturdiode ikke altid ville give et præcist billede af processorens temperatur. Derfor har man i Core 2 processorerne placeret flere dioder rundt i processoren og når man checker temperaturen på sin Core 2 processor er det faktisk et gennemsnit af disse forskellige værdier, som man aflæser.

 

CoffeeCan
 
Elitebruger
Tilføjet:
22-12-2007 11:01:08
Svar/Indlæg:
3394/170
Fin test.. Synes bare det er lidt fesent fra intels side at smide ne 45 nm ud der ikke yder meget bedre end den gamle topmodel ud over lige på oc området..

og måske også strøm forbrug ? Er det ikke noget i for mulighed for at teste?


Polarfar
 
Senior Skribent
Tilføjet:
22-12-2007 11:51:02
Svar/Indlæg:
2309/846
#1 jeg vil prøve med en måling af strømforbruget på den 9770'er jeg har fået i julegave....h*st....jeg mener... til test 🙂 så det er med i overvejelserne.



Lars
 
Elitebruger
Tilføjet:
22-12-2007 11:56:09
Svar/Indlæg:
3712/44
Polarfar > En fsb på 470 Mhz er da også ganske respektabelt for en quadcore, har du prøvet den på andre bundkort endnu? Glæder mig til at høre om dine strømmålinger.

Jeg kan se at Sioux har fået gang i en 9650 også, og efter hans resultater og hvad jeg har set hidtil er de nye 45 nm chips efter alt at dømme noget mildere ved os med max ~200W kompressorkøling.


hamderD
 
Elitebruger
Tilføjet:
22-12-2007 12:13:26
Svar/Indlæg:
7263/260
Fin test Polarfar, Ahh tag så lidt at få smækket en test op af den QX9770 engang 😛 !


Mathis77
 
Elitebruger
Tilføjet:
22-12-2007 12:57:30
Svar/Indlæg:
6293/359
jeg synes inde på toms at ha læst at en QX9650 lammertæver alle andre cpuer i FPS i alle spil den blev testet i.... reallife test må jo være spil og ikke syntetiske test

ellers fin lille test 😉


Polarfar
 
Senior Skribent
Tilføjet:
22-12-2007 13:46:42
Svar/Indlæg:
2309/846
#3

470 er bestemt i den gode ende, men det lader til at den bedre kan lide en højere multiplier. Jeg har ikke testet den med Vapo eller tøris, men en spand med isvand er jo altid ved hånden 🙂





Lars
 
Elitebruger
Tilføjet:
22-12-2007 14:12:45
Svar/Indlæg:
3712/44
#6 > Takker, så har jeg lidt at pejle efter 😉


Pederrs
 
Elitebruger
Tilføjet:
22-12-2007 14:33:43
Svar/Indlæg:
1198/35
Sådan skulle det se ud, men ak....

Ahh man må ikke lyve Polarfar 😀, kassen ser sådan ud:


Den er dobbelt så stor som en normal kasse og der er også kommet en helt ny box køler med :yes:


Hey Lars... long time no see 🙂
Ja de normale quad cores tvinger ret hurtig en 200W kompressor i gulvet, men de nye 45nm bliver ikke varmere end en normal dual core. Det betyder at man godt kan nå de 5GHz på en ~200W kompressor 😉


Polarfar
 
Senior Skribent
Tilføjet:
22-12-2007 15:02:45
Svar/Indlæg:
2309/846
#8 vi lyver altid som gale og håber ingen opdager det 😀

Jeg havde forhørt mig omkring kassen og den nye box-køler, men ingen kunne give et fyldestgørende svar, så jeg regnede med at det var som den forrige. Sådan går det jo nogengange.



lumske
 
Elitebruger
Tilføjet:
22-12-2007 15:36:51
Svar/Indlæg:
3485/76
når ja er det ikke den bling bling køler, intels nye? 😀


CoffeeCan
 
Elitebruger
Tilføjet:
22-12-2007 16:00:54
Svar/Indlæg:
3394/170
#10 Det er vist noget med at den grimme runde stock køler har fået et par blå LED's og blevet lidt større - altså ingen heatpipes - på køler området kunne de lære noget af AMD's heatpipe stock køler

#2 Lyder godt - Håber at noget strømforbrugs test i fremtiden ;)


Claus35
 
Elitebruger
Tilføjet:
22-12-2007 16:04:30
Svar/Indlæg:
5410/123
#3 Min Q6600 B3 render 480 mhz fsb, men ja de 470 er også respektabelt 🙂

#8 I følge diverste programmer smidder min 210 watt @ 3,6 ghz med 1,5 vcore 😐


Emillos
 
Overclocker
Tilføjet:
22-12-2007 16:23:21
Svar/Indlæg:
14079/622
Vi har tidl. skrevet om Intels nye stockkøler, som følger med til QX9650: http://hwt.dk/newsdetails.aspx...



Pederrs
 
Elitebruger
Tilføjet:
23-12-2007 11:42:23
Svar/Indlæg:
1198/35
#9
Haha 🤣..... Jeg udfordre dig til duel! 😎



Køling: Intels gamle box køler 😛


#15
Lars
 
Elitebruger
Tilføjet:
23-12-2007 15:12:55
Svar/Indlæg:
3712/44
Hehe, dueller. Jeg elsker dueller, eller bare et lille battle for den sags skyld.

Pederrs > Ja det er et stykke tid siden, men nu er 45 nm chips'ene jo kommet, og det er juleferie, dvs. tid til at lege lidt igen.

#12 > Hvilket bundkort er det på? Mit P5B-Dlx kan jeg også godt få op på omkring 460 Mhz fsb stabilt med min QX6700, men så kan jeg ikke få mine Corsair 8888 ram til at køre optimal hastighed. Mht. volt så tror jeg det passer meget godt. Ca 3.6 Ghz ved 1.475V i bios er grænsen for hvad mit Mach II GT kan klare til full load på alle 4 kerner med min QX6700.

Nå, jeg må vel hellere få smidt den QX9650ES i Mach'en, nu har den ligget på mit bord i en lille uges tid. 🙂


Claus35
 
Elitebruger
Tilføjet:
23-12-2007 15:43:49
Svar/Indlæg:
5410/123
#15 WB Lars 🙂 Long time no see.

MSI P35 Platinium ftw. ❤ Har set folk rende 560 mhz fsb på det mobo med en dual core, og det koster 1100 kr 😎 ABIT IP35 PRO kan SLET ikke være med 😛
Og jeg har forøvrigt "bare" vandkøling på 🙂

Men kom så med de resultater Lars ! 😀


Pederrs
 
Elitebruger
Tilføjet:
23-12-2007 19:08:37
Svar/Indlæg:
1198/35
Hehe Claus så se hvilken FSB jeg har opnået på mit P5K Premium (og det er med en quad core 😛):
http://valid.x86-secret.com/sh...

Abit IP35 Pro køre fint, når det ellers får den rette bios. Resultatet med QX9650'eren er lavet på Abit bundkortet.

#15
Hehe så må jeg vel hellere se at få smidt min kompressor på den, ellers bliver det vist lidt urimeligt 😀


vanovich
 
Elitebruger
Tilføjet:
23-12-2007 20:15:11
Svar/Indlæg:
3972/242
hi lars welcome back . nice test polar far 😉


Claus35
 
Elitebruger
Tilføjet:
23-12-2007 21:16:45
Svar/Indlæg:
5410/123
#17 Hvad er så den rette BIOS? Jeg har prøvet med to versioner hvor den ene var den der var på da jeg fik det, og så smed jeg den nyest på 😛

350 mhz fsb blev det til, og med Nosfer@tu's hjælp, blev det til slående og utrolige 355 mhz fsb 😐 Så nupper Emillos bundkortet, og smider en QX6700 på og rammer 486 mhz fsb 😐 :-S Og jeg er altså ikke en dårlig clocker, og jeg er slet ikke den eneste der har problemer med at oc Q6600 på IP35, men der er sgu nogen der kan.... Men er der egentligt nogen der har lavet et vellykket oc med IP35 PRO med en Q6600? Og ikke en QX?

EDIT: Pederrs -> Du tæller ikke 😛


Mathis77
 
Elitebruger
Tilføjet:
23-12-2007 21:39:29
Svar/Indlæg:
6293/359
Hey Lars.. WB - du oh stormester ud i monster-OC-tråde 🙂

Så skal vi da snart ha en "ska I ha en lille lars-test?" - tråd igen ikk?


w00t 😲


#21
Lars
 
Elitebruger
Tilføjet:
23-12-2007 22:38:50
Svar/Indlæg:
3712/44
Hey guys, jo tak og jeg er tilbage i oc gamet. Har tilbragt en hyggelig aften med svigerfamilien så jeg regner med at starte op i morgen formiddag med at installere den nye cpu. Indtil videre bare i mit P5B-Dlx.

#16 > Jeg checker lige det bundkort, lyder vildt at MSI laver noget Abit ikke kan følge med, men det mått jo ske på et tidspunkt 😀

#17 > Mon ikke det er en meget god idé med kompressoren....Nice fsb 😉

#18 > Jo tak, jeg har godt nok efterhånden også savnet lidt hardware/oc snak i hverdagen.

#20 > Det skulle undre mig meget om ikke der dukker et eller andet op i løbet af i morgen, i alt fald senest i løbet af jule/nytårs ferien.



Mathis77
 
Elitebruger
Tilføjet:
23-12-2007 23:02:37
Svar/Indlæg:
6293/359
savle savle - vi glæder os kan jeg vist godt sige på vegne af hele hwt.dk 🙂

nu er der en time til d.24!!!!!!!!!!!!

i cant sleep!!!!


😲


#23
Lars
 
Elitebruger
Tilføjet:
23-12-2007 23:16:50
Svar/Indlæg:
3712/44
#22 > LOL, sov du nu bare, jeg sidder ved laptoppen og er ved at være træt, så det bliver først op ad dagen i morgen, og dine gaver får du vel først i morgen aften..... 😀


Pederrs
 
Elitebruger
Tilføjet:
24-12-2007 00:22:30
Svar/Indlæg:
1198/35
#19
Nu kan det jo også være din Q6600 der ikke kan tage en højere FSB. Jeg bruger selv beta bios 16.B04 lige nu. Tjek den her tråd:
http://www.xtremesystems.org/f...


Claus35
 
Elitebruger
Tilføjet:
24-12-2007 09:55:57
Svar/Indlæg:
5410/123
Har kigget på en del af de sider der, men har sgu ikke liiiige læst hele tråden 😐 Jeg har jo så set en masse oc resultater, hvor langt største delen var på dual cores og dem der var med quads var sjovt nok G0'er, hvor min er en B3'er.... Så måske er det med B3 IP35 har probs?

Nå,.... men det er i hvert fald ikke et bundkort jeg ville købe....det kan godt være det er et super oc board, men man kan altså også risikerer, at lårtet ikke funker 😕


#26
Lars
 
Elitebruger
Tilføjet:
27-12-2007 12:44:57
Svar/Indlæg:
3712/44
Nå jeg havde super travlt i julen, og to fødselsdage i familien er der også i julen, så jeg har først fået smækket svinet i nu. Har jo læst lidt reviews rundt omkring så jeg bootede direkte op i windows @ 4 Ghz http://valid.x86-secret.com/sh...

Nu skal der leges de næste par dage.... bare som et lille supplement til Polarfar's test naturligvis 😉


Polarfar
 
Senior Skribent
Tilføjet:
27-12-2007 19:06:59
Svar/Indlæg:
2309/846
#26

lol....ja det vil jo undre alle inklusive mig selv hvis du kan få den over mine 4.4GHz....

hvis du forstår sådan en lille een der 😀

- og godt nytår.



#28
Lars
 
Elitebruger
Tilføjet:
27-12-2007 20:09:38
Svar/Indlæg:
3712/44
#27 > LOL, sjovt nok om jeg ikke lige fik den en smule over de 4.4 Ghz.... 😀


Polarfar
 
Senior Skribent
Tilføjet:
01-01-2008 15:41:00
Svar/Indlæg:
2309/846



så kom en anden under 10sek også. Ikke noget som en lille OC test til at starte 1. januar på 🙂

Jeg skylder at sige at det IKKE er med en QX9650, men en anden QX model 😉