Overbelastning af netværk?

Software d.  02. december. 2008, skrevet af ZnarF
Vist: 397 gange.

ZnarF
 
Elitebruger
Tilføjet:
02-12-2008 14:53:43
Svar/Indlæg:
1058/59
Jeg har et lille problem, og tænkte at der sikkert sad en der vidste lidt mere om netværk end jeg gør (min IT-afdeling gør tilsyneladende ikke 😕 )

Jeg har 23 computere jeg har samlet i et beowolf cluster - 10 af dem fik jeg i sidste uge. De 10 nye (Q6700-8 GB RAM) kører xp64, og udfører nogle parallele beregninger. For at de kan regne, skal de bruge data fra hinanden, det gør de via windows fildeling - via en delt folder.

Når 3 maskiner regner sammen, giver det e konstant load pål ca. 12 % (1Gbps), men ind imellem peaker loaden op på 90 - 100 %. 😲

Når dette sker, mistes forbindelsen til "beregningssharet" kortvarigt, og beregningen chrasher. Jeg har søgt hos Microsoft, og fundet noget der hedder IRPStackSize, men dette gælder kun NT - jeg synes ikke det har en effekt på stabiliteten (http://support.microsoft.com/k... ).

Er der nogen de har en ide til hvad jeg kan gøre (fx prøve en switch med mere backbone?)
Walenad
 
Elitebruger
Tilføjet:
02-12-2008 15:38:54
Svar/Indlæg:
1906/25
Du må forklare lidt mere om dit netværk.

Jeg tænker her på windows-serveren der agerer filserver/shared.

Jeg går ud fra, at du har plads nok jvf. IRPstacksize, som ikke løser dit problem.


scheea2000
 
Superbruger
Tilføjet:
02-12-2008 16:26:04
Svar/Indlæg:
818/58
Måske er jeg ude på dybt vand:

Jeg antager du mister dit share fordi de 3 maskiner ligger beslag på al båndbredde? En løsning kunne vel være at begrænse load mellem de tre maskiner?

Alternatvit findes der måske en timeout indstilling, som kunne ændres?

Desuden lyder windows shares ikke specielt optimalt, når der skal overføres så store datamængder?


ZnarF
 
Elitebruger
Tilføjet:
02-12-2008 21:13:17
Svar/Indlæg:
1058/59
Mange tak for inputs ind til videre 🙂

#1 Mit netværk er bygget op med et domæne, men hvor mit beregningscluster som de eneste maskiner har fast ip (der er DNS + DHCP). Clusteret har sin egen 1Gbps switch (jeg ved ikke hvor stort backbone er).

Det kan principielt være hvilken som helst af maskinerne der er server, men den der har problemet pt. har 130 gb fri - en beregning fylder 30 - 60 gb, så det er ikke det der er problemet.

#2 Det er lige præcis det med at jeg bruger al båndbredde jeg spekulerede på om det kunne være. Jeg har pt. 2 beregninger der hver har den belastning. Nogen der ved hvor jeg i windows kan ændre sådan en timeout indstilling?

Jeg bliver desværre nødt til at bruge windowsfildeling med den måde det hele er bygget op på. De enkelte datafiler er ikke så store, men det er den konstante mængde af data. Før vi fik quadcores var det ikke et problem... Jeg kan også skære ned på mængden af gemte uddata, men det vil gøre jeg skal lave de samme beregninger flere gange - og en beregning tager let 14 døgn ☹


Walenad
 
Elitebruger
Tilføjet:
03-12-2008 12:20:04
Svar/Indlæg:
1906/25
Smid nogen flere netkort i den maskine der agerer filserver og lav noget simpel round-robin.