Home

Siemens RX100 User's Manual

image

Contents

1. 1 Partition f r die Daten 1 Partition f r das Pagefile Microsoft Terminal Services Betriebssystem Disk Organisation Terminal Server Software Microsoft Office 2003 32 bit mit SP 2 Fujitsu Siemens Computers 2006 2007 T4US Messumgebung Die Lastgeneratoren simulieren eine Vielzahl von Benutzern die mit dem Terminal Server arbeiten Ein TAUS Controller steuert und berwacht den gesamten Simulationslauf Der Infrastruktur Server stellt Basisdienste zur Verf gung Lastgenerator Hardware PRIMERGY L200 P200 Lastgeneratoren Prozessor 21 2 x Pentium III 1 27 GHz Memory Netzwerk Interface 2 x100 MBitLAN TAUS Controller und Infrastrukturserver Hardware Model PRIMERGY C200 2 x Pentium III 1 40 MHz 1568 Netzwerk Interface 2 x100 MBit LAN Windows Server 2003 Standard Edition SP1 Netzwerkprotokoll TCP IP RDP Client 5 2 3790 1830 ICA Client 9 00 32649 32 bit T4US Version T4US Lastprofil Medium Lastprofil Seite 26 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Literatur PRIMERGY Systems http www fujitsu siemens de primergy PRIMERGY RX100 S4 http www fujitsu siemens de products standard _servers rack primergy _rx100s4 html PRIMERGY Performance http www fujitsu siemens de products standard _servers primergy _bov html http www spec org osg cpu2000 Benchmark berblick SPECcpu2000 http extranet fujitsu siemens de vil pc vil primergy
2. Der Benchmark ist als Source Code verf gbar und wird vor der eigentlichen Messung kompiliert Daher beeinflussen auch die verwendete Compiler Version und deren Optimierungseinstellungen das Messergebnis SPECcpu2006 beinhaltet zwei verschiedene Methoden der Performance Messung Die erste Methode SPECint2006 bzw SPECfp2006 ermittelt die Zeit die f r die Bearbeitung einer einzelnen Aufgabe ben tigt wird Die zweite Methode SPECint_rate2006 bzw SPECfp_rate2006 ermittelt den Durchsatz d h wie viele Aufgaben parallel erledigt werden k nnen Beide Methoden werden zus tzlich noch in zwei Messl ufe unterteilt base und peak die sich in der Verwendung der Compiler Optimierung unterscheiden Bei der Publikation von Ergebnissen werden immer base Werte verwendet peak Werte sind optional Compiler SuSE peak aggressiv Geschwindigkeit Singlethreaded SPECint_base2006 SPECint_rate2006 Integer peak aggressiv Durchsatz Multithreaded SPECint_rate_base2006 Integer base konservativ SPECIP2006 Flie komma SPECfp_base2006 Flie komma konservativ l Durchsatz Multithreaded Bei den Messergebnissen handelt es sich um das geometrische Mittel aus normalisierten Verh ltniswerten die f r die Einzel Benchmarks ermittelt wurden Das geometrische Mittel f hrt gegen ber dem arithmetischen Mittel dazu dass bei unterschiedlich hohen Einzelergebnissen eine Gewichtung zugunsten der niedrigeren Einzelergebnisse erfolgt No
3. FU ITSU weni We make sure JITSU une Abstract In diesem Dokument sind alle Benchmarks die f r die PRIMERGY RX100 S4 durchgef hrt wurden zusammengefasst Ferner werden die Leistungsdaten der PRIMERGY RX100 S4 mit denen anderer PRIMERGY Modelle verglichen und diskutiert Neben den Benchmark Ergebnissen als solchen wird jeder Benchmark und die Umgebung in der der Benchmark durchgef hrt wurde kurz erl utert Inhalt TOOU ONE e E 2 EE 3 EE ee 7 SFEGIPDZOD D A ES NEN R E E SUIREEDEE NIEREN EUER EEE a S NSORHAEREER 10 lt E 12 T EE 21 Tu E 27 Kontakt dE 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Technische Daten Die PRIMERGY RX100 S4 ist wie ihr Vorg nger PRIMERGY RX100 S3 ein Mono Prozessor Rack Server von einer H heneinheit Sie enth lt den Intel 3000 Chipsatz einen Intel Celeron D Pentium D oder Xeon Prozessor bis zu 8 GB ECC gesch tzten DDR2 533 SDRAM je nach eingesetztem Prozessor einen mit 533 Celeron D 800 Pentium D oder 1067 MHz Xeon getakteten Front Side Bus einen Broadcom BDC5715 2 Kanal 1 GBit Ethernet Controller und Platz f r 2 Festplatten Die SAS Variante der PRIMERGY RX100 S4 besitzt einen 8 Port SAS Controller die SATA Variante einen 2 Port SATA 300 Controller beide mit RAID O und RAID 1 Funktionalit t Detaillierte technische Informationen finden Sie unter http www fujitsu siemens de products standard_servers rack primergy_rx100s4 html Fuji
4. Man erkennt bei random Zugriffen einen Performance Vorteil von ca 25 bei einem RAID 1 gegen ber einer einzelnen Festplatte JBOD Dies erkl rt sich dadurch dass beim Lesen auf beide Festplatten im Spiegel RAID 1 zugegriffen werden kann Bei sequentiellen Zugriffen wirkt sich dies nicht aus so dass die Performance eines RAID 1 und JBOD identisch ist Anders beim RAID 0 bei dem die Daten ber zwei Festplatten verteilt werden Striping hier kann auch bei Fujitsu Siemens Computers 2006 2007 Seite 18 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 sequentiellem Lesen von beiden Festplatten profitiert werden Je nach Zugriffsmuster kann auch bei den RAID Konfigu rationen die Performance um bis 25 gesteigert werden indem der Cache der Festplatte eingeschaltet wird Ein etwas anderes Bild ergibt sich f r die Festplatten mit 15 krpm RAIL Levels Cheetah 15K 5 ST214635558 GAS 146 GE 15 krpm EIB 200 00 Bis Ets A E d E G A G d z o Disk cache on 122 73 12163 2 80 18 87 5155 t2272 106 02 343 2348 om are 14612 402 18 74 63 33 Streaming sequential 64 kB 100 read Restore sequential 64 kB 100 write Database random SEB br read 337 write File Server random PAK 67 read 33 write Filecopy random GAKb 50 read 50 write T OO ET o Im Vergleich zu Festplatten mit 10 krpm erreichen auch bei RAID 1 und RAID O die Festplatten m
5. base Werte verwendet peak Werte sind optional Compiler SPECint2000 peak aggressiv Geschwindigkeit Monoprozessor SPECint_base2000 SPECint_rate2000 an Mono una SPECint_rate_base2000 Muliprozessor SPECIP2000 Flie komma SPECfp_base2000 Flie komma konservativ SPECfp_rate2000 Flie komma na Mono und SPECfp_rate base2000 Flie komma Multiprozessor Bei den Messergebnissen handelt es sich um das geometrische Mittel aus normalisierten Verh ltniswerten die f r die Einzel Benchmarks ermittelt wurden Normalisiert hei t dass gemessen wird wie schnell das Testsystem verglichen mit einem Referenzsystem ist F r das Referenzsystem wurde als SPECint_2000 und SPECfp_2000 Wert 100 festgelegt Im Falle der rate Messergebnisse liegt dieser Wert bei 1 16 So bedeutet beispielsweise ein SPECint_base2000 Wert von 200 f r das Messsystem dass es diesen Benchmark mindestens doppelt so schnell wie das Referenzsystem bew l tigt hat Die ungenaue Bezeichnung mindestens deshalb weil bei der Berechnung des Ergebnisses das geometrische Mittel angewandt wird Gegen ber dem arithmetischen Mittel f hrt dies dazu dass bei unterschiedlich hohen Einzeler gebnissen eine Gewichtung zugunsten der niedrigeren Einzelergebnisse erfolgt Die SPECcpu2000 Messungen werden von uns in der Regel nur f r ausgew hlte Systeme und Systemkonfigurationen zur Ver ffentlichung bei SPEC eingereicht Daher erscheinen die meisten der hier vorgestellten
6. 0 SATA 7 2 Krppm WOCHOOOES cache off me zes me ee wie we one men a Ta a e n o m asara rim YOC w e o ns a Im estarzuen VC cachean a am mm s 20 e GSAS Ikom sms cache olt E SA5 15 krem ST314685555 cache on Fujitsu Siemens Computers 2006 2007 Seite 19 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Man erkennt deutlich dass die Festplatten nur eine bestimmte Anzahl I Os pro Sekunde bew ltigen k nnen Mit steigen der Blockgr se sinkt diese I O Rate sogar etwas ab Die I O Rate h ngt im wesentlichen von der Umdrehungsgeschwin digkeit der Festplatte aber auch da es sich hier um random Zugriffe handelt von den Positionierungszeiten der Platten k pfe und nat rlich auch von der Datendichte mit der die Daten gespeichert werden ab Bei einer Blockgr e von 64 kB ergibt sich f r SATA Platten mit 7 2 krpom eine typische I O Transferrate von 75 f r SAS Festplatten mit 10 krpm von 200 und f r SAS Festplatten mit 15 krom von 260 IO s Dabei hat auch der Festplattencache noch einen Einfluss von bis zu 20 Fazit Es lohnt nicht SATA Festplatten in der PRIMERGY RX100 S4 SAS einzusetzen Die Performance mit SATA Festplatten ist identisch zur der Performance der PRIMERGY RX100 S4 SATA In Abh ngigkeit von der ben tigten Performance ist zu entscheiden ob Festplatten mit 10 krpom oder 15 krpom zum Einsatz kommen sollen Festplatte
7. H BXES0 Ousd H EL O lee Bx300 H RU 53 R600 52 R B00 CO OOOO OOOO 22 EENS Rack o E y solutions BE R 100 54 R 100 53 FRA100 52 T4600 53 T 600 52 T600 Oo E yO Tower O un A T4150 53 T4150 52 H 20 40 G g 100 120 140 160 180 200 220 240 260 Medium U Die dargestellten Den zeka bnz b ien Dezieben Sich auf deh leeren TAUS Medi User EES 1 jeweils ein CPU Blade Stand 15 05 2007 Fujitsu Siemens Computers 2006 2007 Seite 25 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Benchmark Umgebung Unten stehende Grafik zeigt die Umgebung in der die Terminal Server Performance Messungen durchgef hrt wurden Ein Lastgenerator kann eine Vielzahl von Benutzern simulieren da die Anwendungen auf dem Server ablaufen Es wer den bei den Terminal Server Protokollen nur Tastatureingaben und Mausklicks zum Server und nderungen des Bild schirminhalts zum Client bertragen Daher wird keine gro e Netzwerk Bandbreite ben tigt Die Anbindung der Lastsi mulatoren an den Terminal Server auch System under Test SUT genannt erfolgte ber ein 100 MBit Ethernet Netz werk wobei der Terminal Server ber den Gigabit Uplink angeschlossen war Die Benutzerprofile wurden auf dem Ter minal Server gespeichert Auch die Dateien der Benutzer die w hrend der Messung gelesen und geschrieben wurden lagen lokal auf dem Terminal Server Der sich auch im SUT Netzwerk befindende Infr
8. Leistung und zu Pass einem rapiden Anstieg der Antwortzei T ten T Si 100 150 User 200 Bei Terminal Server w chst der Spei cherbedarf bei allen PRIMERGY Sys temen linear mit der Anzahl der Benutzer dies ist auch bei der PRIMERGY RX100 S4 der Fall wie die zwei Grafiken zum 32 bit und 64 bit System veranschaulichen Tr gt man den aus Available MBytes berechneten belegten Speicher den Committed Speicher und das Working Set grafisch auf so erkennt man einen linearen Verlauf der mit steigender Benutzeranzahl w chst Der Anstieg der Geraden ist beim 64 bit Betriebssystem jedoch steiler Das 32 bit Betriebssystem Windows Server 2003 Enterprise Edition mit Microsoft Terminal Services hat einen Grundbedarf von 128 MB und pro Benutzer bzw Client werden weitere 20 MB ben tigt Der Grundbedarf des 64 bit Systems erh ht sich auf ca 150 MB In dem Messszenario arbeiten allerdings alle Benutzer mit der glei chen Applikation daher zeigen alle Benutzergruppen den gleichen Spei e Memory used cherbedarf Der Speicherbedarf ist g hemary committed jedoch von den verwendeten Applikati forking Set onen abh ngig und muss kundenspe zifisch ermittelt werden Hierbei sollte man beachten dass die Gesamtleis en 100 150 User gt 00 tung des Systems durch die schw chste Komponente bestimmt wird Hinzu kommt dass durch die Architektur des 32 bit Betriebssystems die internen Strukturen und der virtuelle Adre
9. TCs sind empfohlene Einstandspreise in PRIMERGY Server i St Geen p fujitsu si de primergy Euro ohne MwSt sofern im Text nicht anderweitig angegeben S mtliche PRIMERGY Performance Lab EES verwendete Hardware und Software Namen sind Handelsnamen und oder mailto primergy benchmark fujitsu siemens com Warenzeichen ihrer jeweiligen Hersteller Copyright Fujitsu Siemens Computers 2006 2007
10. kB instruction 32 kB data on chip pro Core Pentium D 945 2 MB I D on chip pro Core Secondary Cache Xeon 3040 and 3050 2 MB I D on chip pro Chip Xeon 3060 and 3070 4 MB I D on chip pro Chip Memory 8 GB PC2 4200 DDR2 SDRAM Primary Cache Betriebssystem SUSE Linux Enterprise Server 10 64 bit Intel C Fortran Compiler 9 1 Fujitsu Siemens Computers 2006 2007 Seite 9 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 HH SPECjbb2005 ec Benchmark Beschreibung SPECjbb2005 ist ein Java Business Benchmark dessen Fokus auf der Leistung von Java Server Plattformen liegt Im Wesentlichen ist SPECjbb2005 ein modernisierter SPECjbb2000 Die Hauptunterschiede sind e Die Transaktionen sind komplexer geworden um einen gr eren Bereich an Funktionalit t abzudecken e Der Working Set des Benchmarks ist vergr ert worden so dass die Systemlast insgesamt gestiegen ist e _SPECjbb2000 erlaubt nur eine aktive Java Virtual Machine Instanz JVM w hrend SPECjbb2005 mehrere Instan zen zul sst was eine gr ere Realit tsn he insbesondere bei gro en Systemen bewirkt Softwareseitig misst SPECjbb2005 die Effizienz der Implementierungen der JVM Just In Time JIT Compilers Garbage Collection Threads sowie einige Aspekte des Betriebssystems Hardwareseitig wird die Effizienz der CPUs und Caches des Speichersubsystems und die Skalierbarkeit von Shared Memory Systemen SMP gemessen
11. performance Benchmark Ueberblick SPECcpu2000 pdf SPECcpu2000 SPECcpu2006 http www spec org osg cpu2006 http www spec org jbb2005 Benchmark berblick SPECjbb2005 http extranet fujitsu siemens com vil pc vil primergy performance Benchmark_Ueberblick_SPECjbb2005 pdf SPECjbb2005 Informationen ber lOMeter http www iometer org Disk Subsystem Sizing RAID Controller http extranet fujitsu siemens com Vvil pc villprimergy performance sizing disk subsystem sizing_ raid controller 1 0 de pdf Terminal Server Sizing Guide DE http extranet fujitsu siemens com vil pc vil primergy performance sizing terminal server sizing guide de pdf StorageBench Terminal Server Sizing Guide 64 bit Technologie DE http extranet fujitsu siemens com Vvil pc vil primergy performance sizing terminal server sizing guide Terminal Server x64 technologie de pd Microsoft Windows 2003 und Terminal Services http www microsoft com terminalserver Citrix http www citrix de Kontakt PRIMERGY Hardware PRIMERGY Product Marketing mailto Primergy PM fujitsu siemens com PRIMERGY Performance und Benchmarks PRIMERGY Performance und Benchmarks mailto primergy benchmark fujitsu siemens com Lieferung vorbehaltlich Verf gbarkeit technische nderungen ohne Herausgegeben durch Vorank ndigung m glich Korrektur von Irrt mern und Auslassungen ey en vorbehalten Enterprise Products Internet Alle angegebenen Konditionen
12. random 67 read 33 write 8 kB SQL Server Datenbank Log File sequential 100 write 64 kB Bl cke sequential 100 read 64 KB Bl cke sequential 100 write 64 kB Bl cke sequential 100 read 128 kB Bl cke random 70 read 30 write Bl cke 28 kB random 100 read 64 kB Bl cke random 40 read 60 write Bl cke 24 kB random 50 read 50 write 64 kB Bl cke Daraus kann man f nf markante Profile ableiten Lastprofile Zugriffsmuster Block Last Tool Die ersten vier Profile werden mit lometer generiert Bei dem Lastprofil File copy werden mit Betriebssystemfunktionen 500 MB Daten mit 712 Dateien in 64 Verzeichnissen kopiert und der Datendurchsatz ermittelt Fujitsu Siemens Computers 2006 2007 Seite 12 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Messszenario Um vergleichbare Messergebnisse zu erhalten ist es wichtig alle Messungen in identischen reproduzierbaren Umge bungen durchzuf hren Daher liegen StorageBench neben dem oben beschriebenen Lastprofil die folgenden Regeln zugrunde Da in realen Kundenkonfigurationen nur in Ausnahmef llen mit Raw Devices gearbeitet wird sind bei den Untersuchungen zur Leistungsf higkeit der internen Festplatten diese immer mit einem Dateisystem formatiert F r Windows wird NTFS f r Linux ext3 verwendet auch wenn mit anderen Dateisystemen oder Raw Devices eventuell eine h here Leistung erreicht werden k nnt
13. 00 DDR2 SDRAM Betriebssystem Windows Server 2003 Enterprise x64 Edition SP1 Xeon 3060 BEA JRockit R 5 0 P26 4 0 build P26 4 0 10 62459 1 5 0_06 20060529 2101 TE win x86_64 nn Xeon 3070 BEA JRockit R 5 0 P27 2 0 build P27 2 0 19 82330 1 5 0_10 20070515 1627 windows x86_64 Fujitsu Siemens Computers 2006 2007 Seite 11 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 StorageBench Benchmark Beschreibung Um die Leistungsf higkeit von Disk Subsystemen zu beurteilen wurde von Fujitsu Siemens Computers ein Benchmark mit dem Namen StorageBench definiert mit dem ein Vergleich der verschiedenen Storage Anbindungen m glich ist StorageBench nutzt zu diesem Zweck das von der Firma Intel entwickelte Messwerkzeug lometer mit einem definierten Satz von in der Praxis vorkommenden Lastprofilen und einem festgelegten Messszenario Messwerkzeug Seit Ende 2001 ist Iometer ein Projekt bei http SourceForge net und wird von einer Gruppe internationaler Entwickler auf verschiedene Plattformen portiert und weiter entwickelt Iometer besteht aus einer grafischen Bedieneroberfl che f r Windows Systeme und dem so genannten dynamo der f r verschiedene Plattformen verf gbar ist Diese beiden Kom ponenten k nnen seit einigen Jahren unter Intel Open Source License von http www iometer org oder http sourceforge net projects iometer herunter geladen werden Mit lometer hat man die M glichk
14. 33 write 40 0 7 P File erwer random B4KE 67 read 3365 write 24 o as Ia TI wen IT mp Filezopy random b 50 read 503 write ME EI Restore sequential 64kB 100 write mit 10 krpm der Serie Cheetah T10 Bei random Zugriffen profitiert die Cheetah 15K 4 aber klar mit mehr als 30 besse rer Performance von der h heren Rotationsgeschwindigkeit gegen ber den Festplatten mit 10 krom Die 15 krpom Fest platten der Serie Cheetah 15K 5 zeigen dieses Verhalten nicht und sind in allen Bereichen mehr als 30 performanter als die 10 krom Festplatten der Serie Cheetah T10 Diese obigen Messungen wurde jeweils mit einer einzelnen Festplatte JBOD durchgef hrt um die Leistungsf higkeit einer einzelnen Festplatte vergleichen zu k nnen In der Praxis d rften mehr das sichere RAID 1 und wenn es um ulti mative Performance geht RAID O interessant sein Die folgende Grafik zeigt die erreichbaren Datendurchs tze von JBOD RAID 1 und RAID O bei Festplatten mit 10 krom der Cheetah T10 Serie RAID Levels s 200 00 CG d a b d e a b CG d e H b ODisk cache on 36 51 66 23 2 03 13 86 35 84 36 52 85 73 2 57 1745 3640 res 748 An 1507 5343 Streaming sequential 64 kB 100 read Restore sequential 64 kB 100 write Database random skE bis read 337 write File Server random PAK 6T read 33 write Filecop random 64KB 50 read 50 write Bits EIN T OO ET o
15. 4 bit Version bei diesem System eine etwa gleiche Performance liefert wie die 32 bit Version was zeigt dass auf der PRIMERGY RX100 S4 auch das 64 bit Betriebssystem sinnvoll und ohne gro e Leistungseinbu en einge setzt werden kann Dieses Ergebnis kann jedoch nicht auf andere PRIMERGY Systeme bertragen werden gerade bei gr eren Systemen mit zwei und mehr CPU Sockeln hat das 32 bit Betriebssystem im unteren Leistungssegment Vor teile w hrend im Highendbereich das 64 bit Betriebssystem seine Leistung unter Beweis stellen kann Eine ausf hrliche Diskussion von Terminal Server unter x64 findet sich in dem Dokument Terminal Server Sizing Guide 64 bit Technologie siehe Literaturverzeichnis Fujitsu Siemens Computers 2006 2007 Seite 23 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Arbeitsspeicher Den st rksten Einfluss auf die Leis tungsf higkeit des Terminal Servers 37 hit bt der Arbeitsspeicher aus Dabei spiegelt sich dies insbesondere in der Antwortzeit wider denn Windows ver schafft sich bei Bedarf weiteren virtu E ellen Speicher durch Auslagern Swap pen von momentan nicht ben tigten Daten aus dem Arbeitsspeicher RAM in die Auslagerungsdatei Swap File auf Festplatte Da Plattenzugriffe aber mindestens um die Gr enordnung 1000 langsamer sind als Speicher z zugriffe f hrt dies unmittelbar zum 46 Mett used Wenory committed Zusammenbruch der
16. Aeon 0S0 aeon OB Keon SOTO 3 20 GHz 3 GHz 3 40 GHz 1 57 GHz 2 13 GHz 2 40 GHz 2 67 GHz a ME LC 2 ME SLC per core 2 ME LC per core 2 ME SLC per chip 2 MEG SLC per chip 4 ME LO per chip 4 ME SLC per chip 33 MHz FS 500 MHz F amp E 500 MHz Fb 1067 MHz FSB 1067 MIH F3E 1067 MHz FSB 10657 MHz F3E Cores Chip GHz SLC FSB SPECIp_base2000 SPECp_rate_base2000 Celeron D 352 533 MHz 1569 Pentium D 925 2 MB pro Core 800 MHz Pentium D 945 2 MB pro Core 800 MHz 2135 nicht ver ffentlicht bei http www spec org SPECfp_rate_base 000 PRIMERGY RX100 54 du 30 ZU Celeron D 5352 Fentium D 325 Pentium O 345 Fan FO Ken SOSO cn FOR Ken SOTO 3 20 GHz 3 GHz 3 40 GHz 1 57 GHz 2 13 GHz 2 40 GHz 2 61 GHz a ME SL 2 ME LC per core 2 ME SLC per core 2 MG LC per chip 2 ME SLC per chip 4 ME LC per chip 4 ME SLC per chip 33 MHz FSB 500 MHz Fb 500 MHz FP 1067 MHz FSB 1067 MHz FSB 1067 MHz F3E 1067 MHz FSB Fujitsu Siemens Computers 2006 2007 Seite 4 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Leistungszuw chse die sich allein aus einer h heren Prozessortaktfrequenz generieren fallen bei der Integer Testsuite von SPECcpu2000 h her aus als bei der Floating Point Testsuite Dies liegt daran dass die Floating Point Testsuite mehr Speicher ben tigt Gegen ber Cache Zugriffen wirken sich die langsameren RAM Speicherzugriffe st rker auf das Messergebnis aus Daher profitieren Prozessoren mit gro en C
17. Die SATA Variante der PRIMERGY RX100 S4 nutzt den SATA Controller des Chip Satzes Intel ICH7 R Die Lauf werkseinsch be der PRIMERGY RX100 S4 SATA stehen wahlweise als easy change oder hot plug zur Verf gung Dies hat jedoch keine Auswirkung auf die Performance Der SATA Controller kann in vier Modi betrieben werden Compatible Die SATA Ports werden auf PATA Ports PATA parallel ATA abgebildet Dieser Betriebsmodus sollte nur dann verwendet werden wenn das verwendete Betriebssystem keine SATA Treiber f r den ICH7 R bietet oder diese aus anderen Gr nden nicht eingesetzt werden sollen Native In dieser Betriebsart werden die SATA Ports als solche dem Betriebssystem sichtbar gemacht Es werden entsprechende SATA Treiber ben tigt die auf der ServerStart DVD f r die unterst tzen Be triebssysteme mitgeliefert werden AHCI AHCI steht f r Advanced Host Controller Interface und stellt einen erweiterten Betriebsmodus f r SATA Festplatten dar Auch hierf r sind spezielle Treiber im Betriebssystem notwendig AHCI Trei ber erm glichen es die Funktionalit ten des SATA Il Standards wie z B Native Command Queuing NCQ zu nutzen Hierzu muss jedoch der Schreibcache der Festplatten zwingend eingeschaltet sein RAID F r die RAID Funktionalit t RAID 0O und RAID 1 ist ein Software RAID LSI Logic Embedded MegaRAID im BIOS integriert Die Matrix RAID Funktionalit t des Intel ICH7 R steht hierbei nicht zu Verf gung Zwischen den einzel Perf
18. Disk und Netzwerk UO spielen keine Rolle SPECjbb2005 emuliert ein f r moderne Gesch ftsprozess Applikationen typisches Three Tier Client Server System mit Augenmerk auf das Middle Tier System e Clients erzeugen die Last bestehend aus Driver Threads die angelehnt an den TPC C Benchmark OLTP Zugriffe auf eine Datenbank ohne Denkzeiten generieren e Das Middle Tier System implementiert die Gesch ftsprozesse und Aktualisierung der Datenbank e Die Datenbank bernimmt die Datenverwaltung und wird emuliert durch Java Objekte die im Memory liegen Transaktions Logging ist implementiert auf XML Basis Der gro e Vorteil dieses Benchmarks ist dass er alle drei Tiers beinhaltet die gemeinsam auf einem Single Host laufen Gemessen wird die Performance des Middle Tier So werden gro e Hardware Installationen vermieden und direkte Vergleiche von SPECjbb2005 Ergebnissen unterschiedlicher Systeme sind m glich Client und Datenbank Emulation sind ebenfalls in Java geschrieben SPECjbb2005 ben tigt nur das Betriebssystem sowie eine Java Virtual Machine mit J2SE 5 0 Eigenschaften Die Skalierungseinheit ist ein Warenhaus mit ca 25 MB Java Objekten Genau ein Java Thread pro Warenhaus f hrt die Operationen auf diesen Objekten aus Die Gesch ftsoperationen sind von TPC C bernommen e New Order Entry e Payment e Order Status Inquiry e Delivery e Stock Level Supervision e Customer Report Das sind aber auch die einzigen Gemeinsamkeit
19. Ergebnisse auch nicht auf den Web Seiten von SPEC Da wir f r alle Messungen die Protokolldateien archivieren k nnen wir jederzeit den Nachweis f r die korrekte Durchf hrung der Messungen erbringen Die so ermittelten Ergebnisse d rfen daher ver ffentlicht werden Geschwindigkeit Monoprozessor Benchmark Ergebnisse Es wurden Messungen mit dem Celeron D Prozessor 352 den Pentium D Prozessoren 925 und 945 sowie den Xeon Prozessoren 3040 3050 3060 und 3070 durchgef hrt Die SPECint Benchmark Programme wurden als 32 Bit Versionen mit dem Intel C Fortran Compiler 9 1 kompiliert und unter Windows Server 2003 Enterprise Edition SP1 32 bit ausgef hrt Die SPECfp Benchmark Programme wurden als 64 Bit Versionen mit dem Intel C J Fortran Compiler 9 0 kompiliert und unter SUSE Linux Enterprise Server 10 64 bit ausgef hrt SPEC SPECint SPECfp und das SPEC Logo sind eingetragene Warenzeichen der Standard Performance Evaluation Corporation SPEC Fujitsu Siemens Computers 2006 2007 Seite 3 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Cores Chip GHz CC FSB sPECint_base2000 SPECint_rate_base2000 Celeron D 352 1 3 20 20 MB 533 MHz 1287 14 9 Xeon 3060 4 MB pro Chip 1067 MHz 2593 Xeon 3070 4 MB pro Chip 1067 MHz nicht ver ffentlicht bei http www spec org Mr RBE wt rate base 2000 PRIMERGY RX100 54 Celeron D 352 Fentium D 325 Fentium D 345 Aeon SLA
20. Faktor ist kann mit der Formel Mernay Meman os tf on MEMON Ap der ben tigte Arbeitsspeicher bei einer vorgegeben Anzahl Benutzer bzw die Anzahl Benutzer o _ Meman Memon gs SE MEMON Ann bei einer vorgegeben Speichermenge berechnet werden Res mee Das PRIMERGY System RX100 S4 ist ein 1 Socket Server zum Rack Einbau der im Scale Out Szenario seinen Platz hat bei dem eine exzellente Skalierung durch einfaches Hinzuf gen weiterer Server erreicht wird Terminal Server Um gebungen werden in der Praxis als Terminal Server Farm eher auf Basis von 2 Socket Systemen aufgebaut Jedoch wird durch die Dual Core Prozessoren der aktuellen Core Architektur mit diesem 1 Socket System eine Leistung er reicht die in der Vergangenheit Servern mit zwei oder mehr Sockeln vorbehalten war Die PRIMERGY RX100 S4 kann so als einzelner Terminal Server oder in kleineren Konfigurationen ihr Einsatzgebiet finden Folgende Grafik zeigt die PRIMERGY RX100 S4 im Vergleich zu anderen PRIMERGY Systemen In dieser Darstellung wird die h chste erreichbare Benutzeranzahl jedes PRIMERGY Systems als Maximalwert verwendet die mit einer opti malen Hardwarekonfiguration und dem jeweils besten Betriebssystem 32 bit oder 64 bit erreicht wurde Es gibt keine scharfe Grenze wo die Leistung eines Modells endet und die des n chst leistungsf higeren beginnt Jedes PRIMERGY System deckt eine gewisse Bandbreite ab wobei es berlappungen zwischen den Systemen gibt BXBBO
21. SPEC Fujitsu Siemens Computers 2006 2007 Seite 7 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Cores Chip en Jee FSB SPECint_rate_ base2006 SPECint_rate2006 1 Celeron D 352 3 20 MB 533 MHz n a n a Xeon 3040 2 1187 2 MB pro Chip 1067 MHz 21 6 Z Xeon 3050 2 2 13 2 MB pro Chip 1067 MHz 234 245 Xeon 3060 4 MB pro Chip 1067 MHz Xeon 3070 4 MB pro Chip 1067 MHz DO 293 308 Fett gedruckte Ergebnisse sind ver ffentlicht bei http www spec org i SPECint_rate_base2006 PRIMERGY RX100 54 25 zi U Pentium D 325 Pentium O 545 Xeon 2040 Zen 2050 Zepp SIGD Zepp SOTO Die gemessenen SPECint_ rate _2006 Ergebnisse liegen durchg ngig 4 5 ber den SPECint_rate_base2006 Ergebnissen Cores Chip en Jee FsB SPECfp_rate base2006 SPECfp_rate2006 Xeon 3040 2 1 87 2 MB pro Chip 1067 MHz 198 204 Xeon 3050 2 12 13 2 MB pro Chip 1067 MHz 24 2808 Xeon 3060 2 1240 4 MB pro Chip 1067 MHz 237 23 Xeon 3070 2 2 67 4 MB pro Chip 1067 MHz 250 2359 Fett gedruckte Ergebnisse sind ver ffentlicht bei http www spec org SPECfp_Tate_base2006 PRIMERGY RX100 54 Pentium D 325 Pentium D 545 Xeon 2040 weon 5050 Xeon 20A Xeon 2070 Die gemessenen SPECfp_rate_2006 Ergebnisse liegen durchg ngig 3 4 ber den SPECfp_rate_base2006 Ergebnis sen Fujitsu Siemens Computers 2006 2007 Seite 8 27 White Paper Perform
22. September 2006 wurde die PRIMERGY RX100 S4 mit einem Xeon 3060 Prozessor bei einem Speicherausbau mit 8 GB PC2 4200 DDR2 SDRAM vermessen Die Messung wurde unter Windows Server 2003 Enterprise x64 Edition SP1 durchgef hrt Als JVM wurde eine Instanz von JRockit R 5 0 P26 4 0 build P26 4 0 10 62459 1 5 0_06 20060529 2101 win x86_64 von BEA verwendet Im Mai 2007 wurde die PRIMERGY RX100 S4 mit einem Xeon 3070 Prozessor vermessen Als JVM wurde eine Instanz von JRockit R 5 0 P27 2 0 build P27 2 0 19 82330 1 5 0_10 20070515 1627 windows x86_64 von BEA verwendet Alle weiteren Einstellungen blieben im Vergleich zur Messung von September 2006 unver ndert Bei beiden Messungen flossen alle Ergebnisse von 2 bis 4 Warenh usern in das Benchmark Ergebnis ein SPECjbb2005 1 JVM bops JVM boops SPECjbb2005 1 JVM bops JVM boops PRIMERGY RX100 54 PRIMERGY RX100 54 FRIMERGYT DOIO0 SA Xeon 3060 BEA JRackit 5 0 P264 0 FRIMERGYT RxX100 34 Xeon ZUDU BEA JRackit 5 0 P264 0 TUUO0 boops gidi roooc b pz GOOD 2000 2U0DUU UDO 40000 sooo 30000 20000 SZUDUU 19000 10000 1 2 A d 3 T be cn FOR Xeon SOTA warehouses BEA JAockit 5 0 P264 0 BEA JAockit 5 0 P2T 2 0 Benchmark Umgebung Die SPECjbb2005 Messungen wurden auf einer PRIMERGY RX100 S4 mit folgender Hard und Software Ausstattung vorgenommen Hardware Modell PRIMERGY RX100 GA CPU Xeon 3060 und 3070 4 MB I D on chip pro Chip 4 x 2 GB PC2 42
23. TA Festplatten zu best cken DI LA A A wenn die gleiche Performance auch Streaming Restore Database File Server Filecopy mit der kosteng nstigeren cache cache cache cache cache cache cache cache cache cache PRIMERGY RX100 S4 SATA er Op obt Op obt Op off Op off Op ff reicht werden kann Drun eg aen 08 085 57 607 282 pes Ed DROO S4SATA 70 81 69 83 69 26 3444 141 0 63 10 33 32 26 3 30 MES Fujitsu Siemens Computers 2006 2007 Seite 17 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Anders als bei den SATA Festplatten zeigt sich bei den SAS Festplatten keine gro e Leistungsabweichung in Abh ngig keit von der Festplattengr e So zeigen die Festplatten einer Serie Cheetah T10 Cheetah 15K 5 die gleiche Leistung unabh ngig von der Kapazit t Es gibt jedoch Leistungsunterschiede zwischen den einzelnen Festplatten Serien So zeigt wie in der Grafik zu sehen ist die 36 GB Festplatte der Serie Cheetah 15K 4 bei sequentiellen Zugriffen eine deut lich schlechtere Performance als die Festplatten der Serie Cheetah 15K 5 und sie ist sogar langsamer als die Festplatten Performance of 5AS disks of different size ME 120 0 100 0 30 0 UU Streaming sequential 64 KD 100 read Restore sequential 64 KB 100 write Filecopy random PAK 50 read 50 write File Server random 64 kB 6T read 33 write Database random S kE 67 read
24. aa aa At Dt u HCH m el me mel mi mel afl DESS ROERSCH HZ H II a 0 sa C H E AHCI JEDD AHCI RAID 1 Il En Sea Tr AHCI RAID IN RAID RAID GEES SERGE Cache on 70 3 70 2 os 8 0 267 Taoslezlualuaea ozlergd os 5era ois 16 74 jaza oeioeg 11 61 397 Streaming sequential 64 KB 100 read Restore sequential 64 KEB 100 write Database random skE 6r read 33 write File Server random PAK E7 read 33 write Filecopy random 64kB 50 read BUS write T OO ET o JBOD und RAID 1 Datenspiegel schneiden in der Performance nahezu gleich ab Beim sequentiellen Schreiben ist RAID 1 2 bis 5 langsamer Bei random Zugriffen mit lesendem und schreibenden Anteil ist das Software RAID 1 des Betriebssystems in diesem Test Windows 2003 R2 dem BIOS RAID 1 mit einem 70 h heren Datendurchsatz deutlich berlegen hnliches gilt auch f r RAID 0 hier ist das Software RAID mit einer bis zu 40 h heren Leistung beim Datenbankzugriffsmuster dem BIOS RAID O berlegen Interessant ist auch hier wieder der Einfluss des Festplattencaches W hrend er im Betriebsmodus AHCI ohnehin immer eingeschaltet ist zeigt sich im RAID Betriebsmodus mit RAID 1 bei abgeschaltetem Cache ein deutlicher Einbruch der Schreibleistung um den Faktor 7 auf nur 14 auch wenn dieser Einbruch nicht ganz so gravierend ist wie im Betriebs modus Native mit JBOD siehe oben Bei random Zugriffen mit gemischtem Schreib und Leseanteil f llt der Perfor ma
25. aches die den Speicher entlasten st rker bei der Floa ting Point Testsuite als bei der Integer Testsuite Der Pentium D 925 und der Pentium D 945 unterscheiden sich lediglich bez glich der Prozessortaktrate Die im Ver gleich zum Pentium D 925 h here Taktrate des Pentium D 945 wurde in der Integer Testsuite zu 89 und in der spei cherintensiveren Floating Point Testsuite zu 47 in zus tzliche Performance umgesetzt Die Xeon Prozessoren verf gen gegen ber den Pentium D Prozessoren zwar ber eine geringere Prozessortaktrate daf r aber ber eine h here Taktung des Front Side Busses Unterschiedlich ist bei den beiden Prozessortypen auch die Cache Organisation Auch der Xeon 3040 und der Xeon 3050 sowie der Xeon 3060 und der Xeon 3070 unterscheiden sich nur bez glich der Pro zessortaktrate Xeon 3060 und 3070 besitzen gegen ber den Xeon 3040 und 3050 einen doppelt so gro en Second Level Cache der hauptverantwortlich f r deren deutlich bessere Performance ist Die im Vergleich zum Xeon 3060 h here Taktrate des Xeon 3070 wurde in der Integer Testsuite zu 84 und in der speicherintensiveren Floating Point Test suite zu 34 in zus tzliche Performance umgesetzt Die beiden folgenden Grafiken zeigen Ergebnisse der PRIMERGY RX100 S4 im Vergleich zu ihren Vorg ngern in der jeweils performantesten Ausstattung Gegen ber der PRIMERGY RX100 S3 wurde die Integer Performance um 55 und die Floating Point Performance um 19 verbessert Zu beacht
26. ance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Der Pentium D 925 und der Pentium D 945 unterscheiden sich lediglich bez glich der Prozessortaktrate Die im Ver gleich zum Pentium D 925 h here Taktrate des Pentium D 945 wurde in der Integer Testsuite zu 76 base bzw 73 peak und in der Floating Point Testsuite zu 57 base bzw 60 peak in zus tzliche Performance umgesetzt Die Xeon Prozessoren verf gen gegen ber den Pentium D Prozessoren zwar ber eine geringere Prozessortaktrate daf r aber ber eine h here Taktung des Front Side Busses Unterschiedlich ist bei den beiden Prozessortypen auch die Cache Organisation Auch der Xeon 3040 und der Xeon 3050 sowie der Xeon 3060 und der Xeon 3070 unterscheiden sich nur bez glich der Prozessortaktrate Xeon 3060 und 3070 besitzen gegen ber den Xeon 3040 und 3050 einen doppelt so groBen Second Level Cache der hauptverantwortlich f r deren deutlich bessere Performance ist Die im Vergleich zum Xeon 3060 h here Taktrate des Xeon 3070 wurde in der Integer Testsuite zu 66 base und peak und in der Floating Point Testsuite zu 49 base bzw 59 peak in zus tzliche Performance umgesetzt Benchmark Umgebung Alle SPECcpu2000 Messungen wurden auf einer PRIMERGY RX100 S4 mit folgender Hard und Software Ausstattung vorgenommen Hardware Model CPU Pentium D 925 und 945 Xeon 3040 3050 3060 und 3070 Anzahl CPUs Pentium D 945 12 kB instruction 16 kB data on chip pro Core Xeon 32
27. astruktur Server stellt dem zu ver messenden Terminal Server Basisdienste wie Active Directory DNS und Terminal Services Licensing zur Verf gung Ein Login der simulierten Benutzer fand immer gegen das Active Directory statt Controller Lastgeneratoren System Infrastruktur f r die under Test Server Simulation SUT Simulations SUT netzwerk Netzwerk me er switched switched 100 Mbit 100 Mbit PRIMERGY B210 Windows Server 2003 Active Directory Terminal Server Licensing Service PRIMERGY Windows Server 2003 Enterprise Edition gt 20 PRIMERGY Dual Server Windows Server 2003 TS Client TA4US Agent T4US Playback Jeder simuliert bis zu 30 Benutzer PRIMERGY B210 T4US Control System Under Test SUT Der Terminal Server wurde mit den Microsoft Terminal Services betrieben die im Windows Betriebssystem enthalten sind Als Terminal Server Anwendung wurde Microsoft Office 2003 verwendet Auf dem Terminal Server wurde keine weitere Software installiert Hardware Modell PRIMERGY RX100 54 Prozessor 1 x Pentium D 925 945 800 MHz FSB 1 x Xeon 3040 3050 3060 3070 1067 MHz FSB TE Netzwerk Interface 1x1GBitLAN Disk Subsystem 1xSAS controller onboard 2 x Seagate ST37345555 73 GB 10 krpom Windows Server 2003 R2 Enterprise Edition Windows Server 2003 R2 Enterprise x64 Edition Version 5 2 3790 Service Pack 1 Build 3790 Netzwerkprotokoll TCP IP 1 xRAID 1 1 Partition f r das Betriebs system
28. ausfall angesehen und daher abgeschaltet Andererseits wurde er von den Fest plattenherstellern aus gutem Grund zur Steigerung der Schreibperformance integriert Features wie Native Command Queuing NCQ funktionieren gar nur wenn der Plattencache eingeschaltet ist Aus Performance Gr nden ist es gerade bei den im Vergleich zu SAS Festplatten langsam drehenden SATA Festplatten empfehlenswert den Platten Cache einzuschalten Der weitaus gr ere Cache f r I O Zugriffe und damit potentielles Sicherheitsrisiko f r Datenverluste bei Stromausfall sitzt ohnehin im Arbeitsspeicher und wird vom Betriebssystem verwaltet Um Datenverlusten vorzubeugen empfiehlt es sich das System mit einer unterbrechungsfreien Stromversorgung USV auszustatten Die nebenste hende Abbildung zeigt den Einfluss des Caches der i00 Festplatte Um in der grafischen 50 Darstellung die unterschiedlichen absoluten Daten 40s durchs tze der Influence of disk cache of SATA drives pi einzelnen Last Se profile auszuglei E chen wurde eine Streaming Restore Database File Serwer Filecopy N sequential E4 kE sequential 64 kB random kB random 64 kB random 64 kB Geer Be 100 read 100 write E rend 33m JE read 22m read 50 read 50 write Dabei wurde der DD cache off BE e o d bei eingeschalte o Ws ms tem Cache er ODiskeacheott F 6ra os 46 BP pi reichte Daten 70 50 oar we 5s 3656 le durchsatz au
29. blich zur Performance Steigerung bei und es empfiehlt sich diese bei allen Festplatten vorhandene Funktionalit t auch im produktiven Einsatz zu nutzen Dabei ist die Verwen dung einer USV zum Schutz gegen Stromausf lle und damit verbundenem Datenverlust empfehlenswert Alle Installationen sind Standard f r die Messungen wurden keine Optimierungen an Server oder Client durchgef hrt bis auf e Die Page Datei des Betriebssystems wurde auf eine feste Gr e von 4 GB eingestellt e Bei Citrix musste die Grenze von 100 Benutzern pro Server die durch das eingebaute Load Balancing vorgege ben wird aufgehoben werden Rechenleistung Bei der PRIMERGY RX100 S4 kommen neben dem f r Terminal Server ungeeigneten Celeron Prozessor Intel Pentium D bzw Xeon Prozessoren zum Einsatz die mit zwei CPU Kernen Dual Core also zwei physikalischen Prozessoren pro Chip ausgestattet sind Bei den Pentium D Prozessoren ist der Second Level Cache SLC jedem CPU Kern direkt zugeordnet und hat zurzeit eine Gr e von 2 MB pro CPU Kern Die Xeon Prozessoren enthalten einen f r beide CPU Kerne gemeinsamen SLC der beim Xeon 3040 und Xeon 3050 2 MB bzw beim Xeon 3060 und Xeon 3070 4 MB gro ist Auf den Prozessoren die f r die PRIMERGY RX100 S4 angeboten werden sind 32 bit und 64 bit Betriebssysteme ablauff hig Nachfolgend sind die vermessenen Prozessoren mit ihrer Taktfrequenz und Front Side Bus Auslegung spezifiziert e Pentium D 3 GHz 2MB SLC p
30. crosoft Word als Anwendung und der Benutzer schreibt einen bebilderten Text mit einer durch schnittlichen Eingaberate von 230 Anschl gen pro Minute Da die Benutzer versetzt gestartet werden finden w hrend der gesamten Messdauer kontinuierlich An und Abmeldungen sowie Applikationsstarts statt Es hat sich gezeigt dass viele Messtools z B das fr her verwendete CSTK von Citrix im Vergleich zur Realit t zu hohe Benutzerzahlen liefern In unseren neuen Messreihen haben wir dies ber cksichtigt und k nnen daher davon ausgehen dass die ermittelten Benutzerzahlen denen aus realen Produktionsumgebungen nahe kommen Bei einer Aussage von absoluten Benutzerzahlen auf einem Server muss trotzdem der kundenspezifische Last Mix analysiert und mit den Leistungsdaten in diesem Papier in Relation gesetzt werden Obgleich das Resultat der Messungen Anzahl Benutzer pro Server ist sollte man die Ergebnisse in erster Linie relativ betrachten also beispielsweise ein PRIMERGY System A ist doppelt so leistungsf hig wie ein PRIMERGY System B oder die Verdopplung des Arbeitsspeichers resultiert in x Leistungssteigerung Die hier gemessene Anzahl Benutzer pro Server gilt f r Medium Benutzer die mit diesem Lastprofil arbeiten Dieser synthetische Benutzer muss nicht in allen F llen mit einem realen Benutzer korrelieren N here Informationen ber die T4US Messumgebung das Medium Lastprofil und die Resultate der anderen PRIMERGY Modelle fi
31. den gesamten System under Test SUT Simulationslauf zentral und ermittelt Messwerte bereits Lastgenerator w hrend der Messung Auf jedem der Lastgeneratoren laufen mehrere Instanzen des T4US Playback Jedes T4US Playback f ttert einen Terminal Server Client in Echtzeit mit Tastatur und Mauseingaben anhand der mit T4US Record aufgezeichneten Skripte und berwacht die DR en 1 Bildschirminhalte des Terminal T4US S Wu Terminal Server Clients Durch hoch Control Server aufl sende Timer wird so die Antwortzet des Terminal Servers ermittelt Auf jedem der Lastgeneratoren l uft ein T4US Agent der f r die Kommunikation mit dem Controller zust ndig ist die Instanzen von T4US Playback steuert und berwacht und die ermittelten Antwortzeiten zum Controller bertr gt Bei der Messung wird die Anzahl der Benutzer die mit dem Terminal Server arbeitet kontinuierlich erh ht Die Antwort zeiten des Terminal Servers werden vom T4US Controller berwacht und mit gespeicherten Referenzwerten die in einer vorhergehenden Referenzmessung mit nur f nf Benutzern ermittelt worden sind verglichen Wenn sich die Antwortzeit der Anwendung so weit verschlechtert dass sie den vorgegebenen Regeln nicht mehr gen gt wird die Messung been det und man erh lt die Benutzeranzahl als Resultat der Messung Als Lastprofil dient ein Medium User der nur mit einer Anwendung arbeitet und Daten z gig eingibt In unserem Me dium Lastprofil dient Mi
32. e Festplatten geh ren zu den fehleranf lligsten Komponenten eines Computersystems Daher werden in Serversystemen RAID Controller eingesetzt um dem Datenverlust durch den Ausfall von Festplatten vorzubeu gen Dabei werden mehrere Festplatten zu einem Redundant Array of Independent Disks kurz RAID zu sammengefasst Dabei werden die Daten ber mehrere Festplatten derart verteilt dass auch beim Ausfall einer Festplatte alle Daten erhalten bleiben Die gebr uchlichsten Arten um Festplatten in Verb nden zu organisieren sind die RAID Level RAID 1 RAID 5 und RAID 10 Informationen zu den Grundlagen verschiedener RAID Ver b nde sind im Papier Disk Subsystem Sizing RAID Controller zu finden F r die StorageBench Untersuchungen der PRIMERGY Server werden die je nach Plattenanzahl und einge bautem Controller m glichen RAID Konfigurationen verwendet Bei Systemen mit zwei Festplatten RAID 1 bei drei und mehr Festplatten zus tzlich RAID 5 und bei vier und mehr Festplatten zus tzlich RAID 10 sofern der Controller diese RAID Level unterst tzt F r die Messung wird immer eine Messdatei mit einer Gr e von 8 GB verwendet unabh ngig von der Gr e der Festplatte Bei der Beurteilung der Leistungsf higkeit von Il O Subsystemen spielen bei heutigen Systemen die Prozessorleistung und der Speicherausbau des Systems keine signifikante Rolle ein eventuell vorhandener Engpass betrifft in der Regel die Festplatten und den RAID Controlle
33. ecopy random PAK 50H read 50 write T Oo ET Die Grafik zeigt die drei Leistungsklassen der verf gbaren Festplatten im Vergleich Es wurde jeweils die Leistung einer einzelnen Festplatte JBOD vermessen Aufgrund der unterschiedlichen Umdrehungsgeschwindigkeiten der Festplatten f llt das Ergebnis nicht berraschend aus Interessant ist dass die SAS Festplatten mit 10 krom und 15 krpm beim sequentiellen Schreiben auch ohne Cache der Festplatte einen sehr guten Datendurchsatz haben Auch bei random Zugriffen ist der Einfluss des Festplattencaches bei SAS Festplatten nicht ganz so gravierend wie bei der SATA Festplatte mit 7 2 krpm Vergleicht man die Festplatten jeweils bei eingeschaltetem Festplattencache so ist die 10 krpm SAS Festplatte gegen ber der SATA Festplatte mit 7 2 krpm je nach Zugriffsmuster 23 bis 150 leistungsf higer Insbesondere bei random Zugriffen ist die SAS Festplatte wesentlich schneller Die 15 krpm Festplatte ist gegen ber der 10 krpm Festplatte ca 40 performanter Die SATA Festplatten mit 7 2 krpm zeigen in der PRIMERGY RX100 S4 SAS nahezu die gleiche ME Leistung wie in der PRIMERGY Sib RX100 S4 SATA Es ergeben sich nur leichte Unterschiede in Abh n gigkeit von den bereits im vorange gangenen Kapitel diskutierten Betriebsmodi des SATA Control lers Es ist also wenig sinnvoll eine RXA100 54 SATA vs RX100 54 5A5 with SATA disk WOS0O00KS PRIMERGY RX100 S4 SAS mit l SA
34. eit das Verhalten realer Anwendungen bez glich der Zugriffe auf l O Subsysteme nachzubilden Dazu kann man unter anderem die zu verwendenden Blockgr en die Art des Zugriffs wie sequentielles Lesen oder Schreiben wahlfreies Lesen oder Schreiben und auch Mischungen davon konfigurieren Als Ergebnis liefert lometer eine Textdatei mit durch Komma separierten Werten csv mit wesentlichen Kenngr en wie z B Durchsatz pro Sekunde Transaktionen pro Sekunde und durchschnittliche Antwortzeit f r das jeweilige Zugriffsmuster Auf diese Weise kann man die Leistungsf higkeit verschiedener Subsysteme bei bestimmten Zugriffsmustern vergleichen lometer ist in der Lage sowohl auf Subsysteme mit einem Dateisystem als auch auf so genannte Raw Devices zuzugreifen Mit lometer k nnen die Zugriffsmuster verschiedenster Anwendungen simuliert und vermessen werden jedoch bleibt der File Cache des Betriebssystems au er acht und es wird blockm ig auf einer einzelnen Testdatei operiert Zur Untersu chung der Einfl sse des File Caches und des Dateisystems ist es daher sinnvoll ein weiteres Testwerkzeug einzuset zen das Betriebssystemfunktionen und den File Cache des Betriebssystems verwendet Lastprofil Von erheblichem Einfluss auf die Performance eines Speichersystems ist die Art wie Anwendungen auf den Massen speicher zugreifen Beispiele f r verschiedene Zugriffsmuster einiger Anwendungen Anwendung Zugrittsmuster S Datenbank Datentransfer
35. en ist dass die Ergebnisse der PRIMERGY RX100 S4 auf Benchmark Programmen basieren die mit einer neueren Compiler Version erstellt wurden Daher ist das gute Abschneiden der PRIMERGY RX100 S4 im Vergleich zur ihren Vorg ngern nicht ausschlie lich systembedingt sondern teilweise auch auf die neuere Compiler Version zur ckzuf hren SPECint_rate_base2000 PRIMERGY RX100 54 vs predecessors FRIMERG Y R100 FRIMERG YT Ax100 2 FRIMERGY Ax100 3 FRIMERGY Rx100 34 Fentium 4 3 07 GHz Pentium 4 3 40 GH Pentium D 350 3 40 GH xeon 3070 2 671 GHz a ME SLC 1ME LC 2 ME SLC per core 4 ME LC 533 MHz FCB 00 MHz FSP a00 MHz FSE 1067 MHz FSE bC 2100 DOR 3DRARA bC3200p DOR 4D0RAM PC 4200 DOR2 30RART PC2 4200 DOR2S 30RAM Intel Compiler 5 0 Intel Compiler 5 0 Intel Compiler 3 0 Intel Compiler 3 1 PECfp_rate_base2000 PRIMERGY RX100 54 vs predecessors FRIMERGY ARx10i FRIMERGY Ax100 2 PRIMERGY Ax100 3 FRIMERGY PO 34 Fenkium 4 3 07 GHz Fentium A 3 40 GHz Pentium D 350 3 40 GHz xeon SOTO 26T GHz a ME SLC 1ME LG 2 ME SLC per core 4 ME SL 35 MH F45 500 MHo FE 500 Min FE 1067 MHz F3E PCG2m00 DOR 40A Am1 PC3200 DUDP SDPAM PC2 4200 OOR2 4DRAM PC2 4200 DOR2 40A4 M1 Intel Compiler 1 0 Intel Compiler 5 0 Intel Compiler 3 0 Intel Compiler 3 0 Fujitsu Siemens Computers 2006 2007 Seite 5 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Benchmark Umgebung Alle SPECcpu2000 Messungen wurden auf einer PRIMERGY RX100 S4 mit
36. en von SPECjbb2005 und TPC C Die Ergebnisse beider Benchmarks sind nicht vergleichbar SPECjbb2005 besitzt 2 Performance Metriken e bops business operations per second ist die Gesamtrate aller Gesch ftsoperationen die pro Sekunde durchge f hrt werden e _bops JVM ist der Quotient der ersten Metrik und der Anzahl der aktiven JVM Instanzen In Vergleichen verschiedener SPECjbb2005 Ergebnisse m ssen beide Metriken angegeben werden Grundlage f r diese Metriken sind die folgenden Regeln nach denen ein konformer Benchmark Lauf durchgef hrt werden muss Ein konformer Benchmarklauf besteht aus einer Sequenz von Messpunkten mit wachsender Anzahl von Warenh usern und damit von Threads wobei die Anzahl jeweils um ein Warenhaus erh ht wird Gestartet wird mit einem Warenhaus bis zu 2 MaxWH mindestens aber 8 Warenh usern MaxWh ist die Anzahl Warenh user bei der der Benchmark die h chste Operationsrate pro Sekunde erwartet Standardm ig setzt der Benchmark MaxWH mit der Anzahl vom Betriebssystem erkannter CPUs gleich Die Metrik bops ist das arithmetische Mittel aller gemessenen Operations Raten mit MaxWh Warenh usern bis 2 MaxWh Warenh usern SPEC SPECjbb und das SPEC Logo sind eingetragene Warenzeichen der Standard Performance Evaluation Corporation SPEC Fujitsu Siemens Computers 2006 2007 Seite 10 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Benchmark Ergebnisse Im
37. eren Ein fluss auf die Leistung hat jedoch die Gr e des CPU Cache denn durch diesen Cache wird der Front Side Bus entlastet Die Verdopplung des Caches von 2MB beim Xeon 3050 auf 4 MB beim Xeon 3060 in Verbindung mit einer geringen Frequenzerh hung von 0 27 GHz steigert die Benutzeranzahl um ca 15 Eine Frequenzerh hung allein tr gt hingegen weniger zur Steigerung der Benutzeranzahl bei Die absoluten Benutzeranzahlen des 32 bit Systems im Vergleich zum 64 bit System differieren nur im Rahmen der blichen Messschwankungen Beim 64 bit System ist ein gr erer Overhead durch die 64 bit breiten Adresszeiger vorhanden Dies macht sich berall bemerkbar wo diese Daten gelesen oder geschrieben werden beispielsweise beim Auslagern von Speicherbereichen Da mehr Daten verarbeitet werden m ssen hat die Gr e des System Caches einen gr eren Einfluss In Anwen dungsszenarien in denen heute die Einschr nkungen der 32 bit Architektur hinsichtlich fehlender interner Betriebssys temstrukturen oder beschr nktem virtuellen Adressraum eine Ausnutzung der CPU Ressourcen unm glich macht profi tiert man deutlich vom Umstieg auf ein 64 bit Betriebssystem Bei der PRIMERGY RX100 S4 mit einem Dual Core Pro zessor wird man jedoch selten solche Gr enordnungen von Benutzern erreichen bei denen die Betriebssystemres sourcen einen Engpass darstellen Beim Vergleich des 32 bit Betriebssystems mit dem 64 bit Betriebssystem erkennt man dass die 6
38. f eins normiert und der Datendurchsatz ohne Cache als prozentualer Anteil dargestellt Man erkennt dass beim reinen se quentiellen Schreiben der Festplattencache zu einer Verzehnfachung der Leistung f hrt Mit Cache hat die Festplatte beim sequentiellen Schreiben und Lesen bei einer Blockgr e von 64 kB etwa die gleiche Datentransferleistung von 70 MB s Ohne den Festplatten Cache sinkt die Schreibleistung auf ein Zehntel ab Nicht ganz so dramatisch sieht es bei random Zugriffen mit 3 lesenden und nur 3 schreibenden Zugriffen aus Hier wird ohne Cache immerhin noch ca 80 der m glichen Leistung erreicht Bei einem Filecopy ohne Festplatten Cache werden hingegen nur knapp 20 der m glichen Leistung erreicht Alle Messungen wurden mit einer 500 GB Festplatte WD5000KS im Betriebsmodus Native durchgef hrt Obgleich alle SATA Festplatten die f r die Performance of disks of different size PRIMERGY RX100 S4 freigeben sind identische Leistungsdaten von 7200 Umdrehungen pro Minute rpm und eine Zugriffszeit von kleiner 4 ms aufweisen so gibt es doch Leistungsunter IMErs schiede im Detail Bei fast allen Zugriffsmustern 70 zeigen Festplatten mit gr erer Kapazit t einen h heren Datendurchsatz Dies erkl rt sich durch die h here Datendichte bzw gr ere Anzahl an Sl Schreib Lese K pfen die bei Festplatten gr e 40 rer Kapazit t zum Einsatz kommen Daher k n nen mehr Daten w hrend einer Umdrehung der Streaming Festp
39. folgender Hard und Software Ausstattung vorgenommen Hardware PRIMERGY RX100 S4 Celeron D 352 CPU Pentium D 925 und 945 Xeon 3040 3050 3060 und 3070 Celeron D 12 kB instruction 16 kB data on chip Primary Cache Pentium D 12 kB instruction 16 kB data on chip pro Core Xeon 32 kB instruction 32 kB data on chip pro Core Celeron D Y MB I D on chip Secondary Cache Pentium D 2 MB I D on chip pro Core Xeon 3040 und 3050 2 MB I D on chip pro Chip Xeon 3060 und 3070 4 MB I D on chip pro Chip 8 GB DDR2 533 SDRAM Betriebssystem SPECint Windows Server 2003 Enterprise Edition SP1 32 bit SPECfp SUSE Linux Enterprise Server 10 64 bit Compiler SPECint Intel C Fortran Compiler 9 1 SPECfp Intel C Fortran Compiler 9 0 Fujitsu Siemens Computers 2006 2007 Seite 6 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 H SPECcpu2006 spec Benchmark Beschreibung SPECcpu2006 ist ein Benchmark der die Systemeffizienz bei Integer und Flie komma Operationen misst Er besteht aus einer Integer Testsuite SPECint2006 die 12 Applikationen enth lt und einer Flie komma Testsuite SPECfp2006 die 17 Applikationen enth lt Beide Testsuiten sind extrem rechenintensiv und konzentrieren sich auf die CPU und den Speicher Andere Komponenten wie Disk l O und Netzwerk werden von diesem Benchmark nicht ver messen SPECCcpu20086 ist nicht an ein spezielles Betriebssystem gebunden
40. it 15 krpm einen ca 30 h heren Datendurchsatz Allerdings hat der Festplattencache einen wesentlich gr eren Einfluss Ohne Festplat tencache bricht die Performance beim sequentiellen Schreiben gegen ber einer einzelnen Festplatte JBOD sogar um mehr als den Faktor zwei ein Bei einem RAID 1 bringt der Festplattencache je nach Zugriffsmuster zwischen 18 und 44 mehr Leistung bei einem RAID O zwischen 15 und 128 Betrachtet man die Datendurchs tze der einzelnen Zugriffsmuster so dr ngt sich die Frage auf warum die Datendurch s tze bei random Zugriffen und im speziellen bei dem Datenbank Profil im Vergleich zu sequentiellen Zugriffen so extrem gering sind Dies wird transparent wenn man anstelle des Datendurchsatzes die Disk I O Rate betrachtet Da tendurchsatz und Disk I O Rate sind direkt proportional zueinander und lassen sich nach der Formel Datendurchsatz MB s Disk Os x Blockgr e MB berechnen Die folgende Grafik zeigt die Anzahl Disk I Os bei random Zugriffen mit Blockgr en von 1 kB bis 128 kB f r die Festplatten der Klasse SATA 7 2 krpm SAS 10 krpm und 15 krpm bei jeweils ein und ausgeschaltetem Festplatten cache Disk lO s in case of random access Os 350 300 250 ge l LOO SAS 15 krpom ST314635555 cache on DU a opa p 9 a r a A F ar z SAS 15 k pm ST314635555 cache off 100 CH SAS 10 krpm ST314675555 cache on SAS 10 krpm 5ST314675555 cache off el SATA 7 2 km w DCROOOEZ cache on
41. latte verarbeitet werden ZU Restore um Filesopy File Server Database SFHODSOHJ wl SPz5040 WDOCHONDES DU GE 160 GE Zb GE HD0 GE T e krpm T krpm r 2 krpm T kpm Fujitsu Siemens Computers 2006 2007 Seite 15 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Einen weiteren Einfluss auf die Leistungsf higkeit eines Disk Subsystems hat der verwendete RAID Level Alle bislang vorgestellten Messergebnisse wurden zwecks Vergleichbarkeit mit nur einer Festplatte JBOD Just a Bunch Of Disks durchgef hrt Die PRIMERGY RX100 S4 fasst nur zwei Festplatten Von daher kommen nur der RAID Level 1 Daten spiegelung oder RAID O Daten Striping in Betracht Dabei ist zu beachten dass RAID O zwar eine h here Perfor mance aber keinerlei Datenredundanz beim Ausfall einer Festplatte bietet Daher ist RAID O nur f r Server sinnvoll deren Daten jederzeit reproduziert werden k nnen zum Beispiel in read only Web Serverfarmen Neben der im BIOS integrierten RAID Funktionalit t kann auch die Software RAID Funktionalit t des Betriebssystems genutzt werden Dabei bietet Letzteres sogar flexiblere L sungen wie beispielsweise auf einem Teil der beiden Fest platten ein sicheres RAID 1 f r Betriebssystem und wichtige Daten und auf dem anderen Teil ein schnelles unsicheres RAID O f r Daten auf die sehr schnell zugegriffen werden muss einzurichten RAID Levels mt EI EI SUNG e EEE e BR a EEE 5 e BM aag
42. m 146 GB Fujitsu Siemens Computers 2006 2007 Seite 20 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Terminal Server Benchmark Beschreibung F r die Messungen von Terminal Server gibt es verschiedene Lastsimulations werkzeuge deren Messergebnisse nicht miteinander vergleichbar sind aber keinen Standard Benchmark Die existierenden Lastsimulatoren sind nicht in der u er Lage Microsoft Terminal Services und Citrix Presentation Server unter den glei RE chen Bedingungen zu vermessen oder haben andere Einschr nkungen Fujitsu Siemens Computers setzt daher ein selbst entwickeltes Programm namens T4US Tool for User Simulation ein Die ses flexible Werkzeug das beliebige Terminal Server artige Szenarien simulieren kann ist unabh ngig vom verwende ten Betriebssystem und von der Anwendersoftware und kann eine detaillierte Messwerterfassung von Antwortzeiten und Auslastung unterschiedlichster Systemkomponenten vorneh ON men wx S Ke vw 8 Benutzeraktivit ten wie Tastatur und Mauseingaben sowie KN E Bildschirmausgaben k nnen mit Hilfe des Aufzeichnungs Benutzer be T4US T4US werkzeugs T4US Record in Echtzeit aufgezeichnet und in der Arbeit Record Skript einem T4US Skript gespeichert werden T4US Skripte wer den w hrend der Messung als Lastprofil verwendet Der Lastsimulator von T4US besteht aus drei Komponenten TA4US Control steuert und berwacht
43. n mit 15 krpm bieten eine ca 30 bessere Performance F r maximale Performance empfiehlt es sich den Cache der Festplatten einzuschalten Je nach verwendetem Plattentyp und Zugriffsmuster liegt die Performance Steigerung bei bis zu 128 Bei aktiviertem Festplattencache ist der Einsatz einer USV empfehlenswert Benchmark Umgebung Alle hier vorgestellten Messungen wurden mit den im Folgenden aufgelisteten Hardware Komponenten und Software Versionen durchgef hrt PRIMERGY RX100 S4 SATA BIOS 1 00 2532 2006 09 26 Controller Intel ICH7 R RAID BIOS LSI MegaRAID Software RAID BIOS Version A 01 09111819R Treiber pciide sys Version 5 2 3790 0 Treiber MegaSR sys Version 06 04 0721 2006 PRIMERGY RX100 S4 SAS BIOS 1 03 2532 2006 11 23 Controller onboard LSI 1068 basierender SAS RAID Controller IME RAID BIOS LSI Logic MPT SAS BIOS 6 08 0400 2006 07 13 Treiber Isi sas syS Version 1 21 13 00 Software Betriebssystem Windows Server 2003 R2 Standard Edition Dateisystem NTFS Test Tool Iometer 2004 07 30 Test Daten Iometer Messdatei von 8 GB Copy Daten von 500 MB Festplatten S26361 H978 WDS5000KS SATA 7 2 krpm 500 GB S26361 H901 SP2504C SATA 7 2 krpm 250 GB S26361 H909 WD1600JJ SATA 7 2 krpm 160 GB S26361 H899 SPHDO80OHJ SATA 7 2 krpm 80 GB S26361 H979 ST373355SS SAS 10 krpm 73 GB S26361 H980 ST3146755SS SAS 10 krpm 146 GB S26361 H896 ST336754SS SAS 15 krpm 36 GB S26361 H966 ST373455SS SAS 15 krpm 73 GB S26361 H967 ST3146855SS SAS 15 krp
44. nce Verlust nicht ganz so gravierend aus sinkt aber immer noch auf 80 bis 30 je nach Zugriffsmuster Alle Messungen wurden mit einer 500 GB Festplatte WD5000KS im Betriebsmodus RAID bzw AHCI f r Software RAID durchgef hrt Fazit Bei SATA Festplatten kann auf den Festplattencache nicht verzichtet werden ohne dass ein gravierender Performance Verlust hingenommen werden muss F r maximale Performance sollte der SATA Betriebsmodus AHCI gew hlt werden Die Software RAID L sung des Betriebssystems zeigt sich gegen ber dem BIOS RAID performanter und hinsichtlich der Konfigurationsm glichkeiten flexibler Fujitsu Siemens Computers 2006 2007 Seite 16 27 White Paper Performance Report PRIMERGY RX100 S4 PRIMERGY RX100 S4 SAS Die SAS Variante der PRIMERGY RX100 S4 beinhaltet onboard einen LSI Version 2 2 Juni 2007 Logic 1068 SAS RAID Controller Wahlweise k nnen SAS Festplatten mit einer Umdrehungsgeschwindigkeit von 10 krpm oder 15 krpm oder SATA Festplatten mit 7 2 krpm verwendet werden Disk types SATA 7 2 krpm 5A5 10 krpm 5A5 15 krpm a a ee O SATA 500 GB 7 2 krpm WOCEO00ES u IS de F EI 3 b d DCacheoft 682 67 08 47 D DCacheon 703 833 08 57 282 j A 365 F Streaming sequential 64 KE 100 read Restore sequential 64 KEB 100 write Ostabase random kB rs read 33 write File Server random PAK 67 read 33 write Fil
45. ndet man im Terminal Server Sizing Guide Fujitsu Siemens Computers 2006 2007 Seite 21 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Benchmark Ergebnisse F r ein Server System sind die folgenden Performance relevanten Faktoren ma geblich e Rechenleistung e Arbeitsspeicher e Disk Subsystem e Netzwerk Einen erheblichen Einfluss auf die Terminal Server Leistung hat die zugrunde liegende Netzwerkinfrastruktur Da wir hier die Leistungsf higkeit eines einzelnen Terminal Servers diskutieren wurde das Netzwerk so dimensioniert dass es keinen Engpass darstellt Eine weitere performance relevante Komponente ist das Disk Subsystem In der hier verwendeten Messumgebung werden die lokalen Festplatten des Terminal Server Systems f r das Betriebssystem den Pagefile und die Daten der Benutzer verwendet Dies entspricht jedoch nicht zwingend der realen Kundenkonfiguration denn dort wird man die Benutzerdaten typischerweise auf entsprechende Disk Subsysteme oder externe File Server legen und nicht auf die lokalen Festplatten eines Terminal Servers Aufgrund der Systemeigenschaften der PRIMERGY RX100 S4 wurden die beiden SAS Festplatten in einem RAID 1 Verband konfiguriert und f r Betriebssystem Daten und Pagefile wurden je weils eigene Partitionen eingerichtet Um einen maximalen Durchsatz zu erreichen wurden alle Caches auch die Write Caches eingeschaltet Write Caches der Festplatten tragen erhe
46. ormance of SATA operation modes nen Betriebsmodi sind durchaus Perfor mance Unterschiede zu verzeichnen Die nebenstehende Grafik und Tabelle zeigt 68 00 Messergebnisse je weils mit einer Fest 1000 platte JBOD in den am vier Betriebsmodi Compatible Native AHCI und RAID Alle 400 Messungen wurden 200 mit einer 500 GB Festplatte WD5000KS mit eingeschaltetem Festplattencache durchgef hrt W h rend bei sequentiellem Zugriff die Unter schiede im Bereich der Messungenauigkeit liegen so zeigen sich bei random Zugriffen Leistungsvorteile im Betriebsmodus AHCI Dies ist auf Funktionalit ten wie Native Command Queuing NCQ zur ckzuf hren ME 70 00 6 00 Streaming sequential 64 KB 100 read Restore sequential 64 kB 100 write e File Server random 64KB Gri read 337 write Database random GK 67 read 33 write da nmn BE Compatible Hate AHCI UG 0 34 um TI om O Database random kB 6TH read 33 write 6 04 I e O File Server random 64KB Gd read 33 write 70 37 0 2 A File Server random 64KBE GTH read 33 write E Streaming sequential E4 KE 100 read Fujitsu Siemens Computers 2006 2007 Seite 14 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Einen weiteren signifikanten Einfluss auf die Disk l O Performance hat der Cache der Festplatten Dieser wird leider h ufig als Sicherheitsproblem bei Strom
47. puters 2006 2007 Seite 22 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Wie man in der unten stehenden Abbildung leicht erkennt ist die Leistung der Prozessoren im Anwendungsszenario eines Terminal Servers nicht ausschlie lich von der Taktfrequenz abh ngig Die Leistungsf higkeit der Prozessoren ist vielmehr abh ngig vom Prozessortyp der Cache Gr e und der Geschwindigkeit des Front Side Busses W hrend die Pentium D Prozessoren auf der lteren T E 32 hit Netburst Architektur basieren sind 7 160 die Xeon Prozessoren eine Entwicklung auf der Basis der CO aktuellen Core Microarchitektur 120 von Intel die trotz niedrigerer Taktung und geringerem V Stromverbrauch eine hervor ragende Rechenleistung bietet Vergleicht man innerhalb einer Prozessorgeneration die Leis tungssteigerung die sich aus der i Erh hung der Taktfrequenz ergibt so erkennt man dass sich die Pentium D Pentium D eon 3040 meon 3050 meon 3060 seon 2070 Frequenzsteigerung nicht 1 1 in DC DC DC DC DC DC der relativen Performance Steige obs 34MCHz 187CHz 243GHz 240CHz 2 67 GHz rung widerspiegelt Dies erkl rt 2x2 MB SLC2K2 MB SLC 2MBSLC 2MESLC 4MBSLC 4ME SLE LO An DEE Front Side Bus FSB und der DUU iz oU lz 1066 MHZ 10pb iz 1066 Hz 1066 ds somit unver nderten Geschwindig keit bei Speicher und I O Zugrif Medium Lastprofil Microsoft Office 2003 Microsoft Terminal Services fen Einen deutlich gr
48. r und nicht CPU und Memory Daher brau chen unterschiedliche Ausbauvarianten mit CPU und Speicher unter StorageBench nicht untersucht zu werden Messergebnisse StorageBench liefert pro Lastprofil verschiedene Kenngr en z B den Datendurchsatz in Megabytes pro Sekunde kurz MB s die Transaktionsrate in I O Operationen pro Sekunde kurz IO s und die Latenzzeit oder auch mittlere Zugriffszeit in ms F r die sequentiellen Lastprofile ist der Datendurchsatz die signifikante Messgr e w hrend bei den random Lastprofilen mit ihren kleinen Blockgr en weniger der Datendurchsatz als vielmehr die Transaktionsrate rele vant ist Fujitsu Siemens Computers 2006 2007 Seite 13 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Benchmark Ergebnisse Die PRIMERGY RX100 S4 kann mit maximal zwei 3 Festplatten best ckt werden Trotz dieses begrenzten Ausbaus steht eine Vielzahl von Konfigurationen zur Verf gung So ist die PRIMERGY RX100 S4 in zwei Varianten verf gbar eine Variante mit SATA Controller onboard und eine SAS Variante mit einem onboard SAS Controller Die SAS Variante wiederum kann sowohl mit SAS als auch mit SATA Festplatten betrieben werden Die Bandbreite der zur Verf gung stehenden Festplatten reicht hinsichtlich der Kapazit t von 36 GB bis 500 GB und bez glich der Umdrehungsgeschwin digkeit von 7 2 krpm bis 15 krpm rpm revolutions per minute PRIMERGY RX100 S4 SATA
49. rmalisiert hei t dass gemessen wird wie schnell das Testsystem verglichen mit einem Referenzsystem ist Der Wert 1 wurde f r die SPECint_base2006 SPECint_rate_base2006 SPECfp_base2006 und SPECfp_rate_base2006 Ergebnisse des Referenzsystems festgelegt So bedeutet beispielsweise ein SPECint_base2006 Wert von 2 dass das Messsystem diesen Benchmark etwa doppelt so schnell wie das Referenzsystem bew ltigt hat Ein SPECfp_rate_base2006 Wert von 4 bedeutet dass das Messsystem diesen Benchmark etwa AIR base copies mal so schnell wie das Referenzsystem bew ltigt hat base copies gibt hierbei an wie viele parallele Instanzen des Benchmarks ausgef hrt worden sind Nicht alle SPECcpu2006 Messungen werden von uns zur Ver ffentlichung bei SPEC eingereicht Daher erscheinen auch nicht alle Ergebnisse auf den Web Seiten von SPEC Da wir f r alle Messungen die Protokolldateien archivieren k nnen wir jederzeit den Nachweis f r die korrekte Durchf hrung der Messungen erbringen Geschwindigkeit Singlethreaded Benchmark Ergebnisse Es wurden Messungen mit den Prozessoren Pentium D 925 und 945 sowie den Prozessoren Xeon 3040 3050 3060 und 3070 durchgef hrt Alle Benchmark Programme wurden mit dem Intel C Fortran Compiler 9 1 kompiliert und unter SUSE Linux Enterprise Server 10 64 bit ausgef hrt SPEC SPECint SPECfp und das SPEC Logo sind eingetragene Warenzeichen der Standard Performance Evaluation Corporation
50. ro Kern 800 MHz Front Side Bus e Pentium D 3 40 GHz 2MB SLC pro Kern 800 MHZ Front Side Bus e Xeon 3040 1 87 GHz 2MB SLC pro Chip 1067 MHz Front Side Bus e Xeon 3050 2 13 GHz 2MB SLC pro Chip 1067 MHz Front Side Bus e Xeon 3060 2 40 GHz 4 MB SLC pro Chip 1067 MHz Front Side Bus e Xeon 3070 2 67 GHz 4 MB SLC pro Chip 1067 MHz Front Side Bus In diesem Performance Report wird Terminal Server sowohl unter dem 32 bit Betriebssystem Windows Server 2003 R2 als auch unter dem 64 bit Betriebssystem Windows Server 2003 R2 x64 untersucht Die 32 bit und 64 bit Versionen von Windows Server 2003 R2 basieren dabei auf der gleichen Code Basis und sind daher direkt vergleichbar Desweiteren ist Windows Server 2003 R2 bis auf einige zus tzliche Dienste und Tools identisch mit Windows Server 2003 Service Pack 1 so dass alle im Folgenden vorgestellten Messergebnisse f r alle oben genannte Betriebssystemversionen gelten F r die 64 bit Messungen wurden die gleichen Randbedingungen verwendet wie bei den 32 bit Messungen Die simulierten Benutzer arbeiteten in beiden F llen mit dem Medium Lastprofil unter Verwendung von Microsoft Office 2003 Die Leistungsf higkeit der Prozessoren wurde hinsichtlich ihrer Taktfrequenz und Skalierbarkeit unter Terminal Server untersucht Bei der Analyse der Rechenleistung waren alle Systeme mit gen gend Arbeitsspeicher ausgebaut damit die Kompo nente bei diesem Vergleich keinen Engpass darstellt Fujitsu Siemens Com
51. ssraum eingeschr nkt sind Jedoch trifft dies auf die PRIMERGY RX100 S4 nicht in dem Ma e zu wie bei anderen PRIMERGY Systemen da sie im maxi malen Speicherausbau auf 8 GB begrenzt ist Insbesondere Anwendungen die Speicher und nicht CPU limitiert sind profitieren von der en 64 bit Architektur Dabei sollte aber auch nicht 359 verschwiegen werden dass 64 bit Betriebs ep systeme und 64 bit Anwendungen in der 60 B Regel mehr Arbeitsspeicher ben tigen als die A 32 bit Versionen denn alle Adresszeiger sind 53 bei 64 bit doppelt so breit Im Extremfall f hrt 20 das bei 64 bit zu einem doppelten Speicher bedarf im Vergleich zu 32 bit Wie die neben 20 stehende Grafik zeigt belegt der gleiche Be nutzer der den Desktop gestartet hat und mit 10 Microsoft Word 2003 arbeitet auf dem 64 bit U System ca 60 mehr Arbeitsspeicher Die Anwendung mit der der Terminal Server Mernory used Memor Committed Working Set Benutzer arbeitet ist in beiden F llen 32bit G4 bi 32hi Ga 32bit 64 bit Microsoft Word welches heute nur als 32 bit Version existiert Die Microsoft Terminal Medium Lastprofil Microsoft Office 2003 Microsoft Terminal Services Services liegen als Bestandteil des Betriebs systems in einer 64 bit Version vor Fujitsu Siemens Computers 2006 2007 Seite 24 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 Da meist der Arbeitsspeicher der limitierende
52. tsu Siemens Computers 2006 2007 Seite 2 27 White Paper Performance Report PRIMERGY RX100 S4 Version 2 2 Juni 2007 H SPECcpu2000 spec Benchmark Beschreibung SPECcpu2000 ist ein Benchmark der die Systemeffizienz bei Integer und Flie komma Operationen misst Er besteht aus einer Integer Testsuite SPECint2000 die 12 Applikationen enth lt und einer Flie komma Testsuite SPECfp2000 die 14 Applikationen enth lt Beide Testsuiten sind extrem rechenintensiv und konzentrieren sich auf die CPU und den Speicher Andere Komponenten wie Disk I O und Netzwerk werden von diesem Benchmark nicht ver messen SPECCcpu2000 ist nicht an ein spezielles Betriebssystem gebunden Der Benchmark ist als Source Code verf gbar und wird vor der eigentlichen Messung kompiliert Daher gehen die verwendete Compiler Version und Optimierungseinstel lungen in die Messung mit ein SPECcpu2000 beinhaltet zwei verschiedene Methoden der Performance Messung Die erste Methode SPECint2000 bzw SPECfp2000 ermittelt die Zeit die f r die Bearbeitung einer bestimmten Aufgabe ben tigt wird Die zweite Me thode SPECint_rate2000 bzw SPECfp_rate2000 ermittelt den Durchsatz d h wie oft eine Aufgabe in einer vorgege benen Zeit erledigt werden kann Beide Methoden werden zus tzlich noch in zwei Messl ufe unterteilt base und peak die sich in der Verwendung der Compiler Optimierung unterscheiden Bei der Publikation von Ergebnissen wer den immer

Download Pdf Manuals

image

Related Search

Related Contents

Anchor Audio AN-130 loudspeaker  Funkwerk R3002  Les scellants et les mastics  USER MANUAL - Analog Way  JUMBO 6000 Profiline - PÖTTINGER Landtechnik  cut50m FRANC  PROFINET User Manual for Encoder  Artsound HSW-16  4.2.2. Error Code and Troubleshooting  1 Indicaciones de seguridad 2 Función  

Copyright © All rights reserved.
Failed to retrieve file