szmtag
Spektrum der Wissenschaft spektrumdirekt Sterne und Weltraum Gehirn&Geist epoc SciLogs WiS! Science-Shop

DIE GEWÜNSCHTE SEITE KONNTE LEIDER NICHT GEFUNDEN WERDEN

Die von Ihnen angegebene Internetadresse konnte auf unserem Server nicht gefunden werden. Eventuell hat sich die URL der gewünschten Seite geändert oder sie ist nicht mehr vorhanden. Bitte überprüfen Sie zur Sicherheit noch einmal die Schreibweise.
Wenn Sie ein Lesezeichen/Bookmark auf die Seite gelegt haben, sollten Sie dieses gegebenenfalls aktualisieren.
 
Hier finden Sie die Hauptstartseiten:

Wenn Sie Fragen oder Probleme haben und sich mit uns in Verbindung setzen möchten, nutzen Sie am besten unsere Kontaktseite.

Mit herzlichen Grüßen

Ihr Team von wissenschaft-online
 
Science-Shop
Stephan Thesmann
Über die Kombination von guter Gestaltung und technischer Umsetzung »
 
Spektrum der Wissenschaft
Testen Sie drei aktuelle Ausgaben von Sterne und Weltraum zum Vorzugspreis von EUR 15,30 inkl. Versand. »
Die Spektrum CD-ROM enthält den kompletten Inhalt (inklusive Bilder) des Jahrgangs 2008 von Spektrum der Wissenschaft als PDF-Version. Zur besseren Nutzung Ihres Heftarchivs finden Sie auf der CD... »
 

DenkMal

Was sollte man besser immer im Auge behalten?
Grüner Elefant
Den gelben Fleck
Den roten Faden
Den Blauen Riesen
Den grünen Elefanten
top


wissenschaft-online
szmtag

DIE GEWÜNSCHTE SEITE KONNTE LEIDER NICHT GEFUNDEN WERDEN

Die von Ihnen angegebene Internetadresse konnte auf unserem Server nicht gefunden werden. Eventuell hat sich die URL der gewünschten Seite geändert oder sie ist nicht mehr vorhanden. Bitte überprüfen Sie zur Sicherheit noch einmal die Schreibweise.
Wenn Sie ein Lesezeichen/Bookmark auf die Seite gelegt haben, sollten Sie dieses gegebenenfalls aktualisieren.
 
Hier finden Sie die Hauptstartseiten:

Wenn Sie Fragen oder Probleme haben und sich mit uns in Verbindung setzen möchten, nutzen Sie am besten unsere Kontaktseite.

Mit herzlichen Grüßen

Ihr Team von wissenschaft-online
 
Science-Shop
Stephan Thesmann
Über die Kombination von guter Gestaltung und technischer Umsetzung »
 
Spektrum der Wissenschaft
Testen Sie drei aktuelle Ausgaben von Sterne und Weltraum zum Vorzugspreis von EUR 15,30 inkl. Versand. »
Die Spektrum CD-ROM enthält den kompletten Inhalt (inklusive Bilder) des Jahrgangs 2008 von Spektrum der Wissenschaft als PDF-Version. Zur besseren Nutzung Ihres Heftarchivs finden Sie auf der CD... »
 

DenkMal

Was sollte man besser immer im Auge behalten?
Grüner Elefant
Den gelben Fleck
Den roten Faden
Den Blauen Riesen
Den grünen Elefanten
top
wissenschaft-online
szmtag

DIE GEWÜNSCHTE SEITE KONNTE LEIDER NICHT GEFUNDEN WERDEN

Die von Ihnen angegebene Internetadresse konnte auf unserem Server nicht gefunden werden. Eventuell hat sich die URL der gewünschten Seite geändert oder sie ist nicht mehr vorhanden. Bitte überprüfen Sie zur Sicherheit noch einmal die Schreibweise.
Wenn Sie ein Lesezeichen/Bookmark auf die Seite gelegt haben, sollten Sie dieses gegebenenfalls aktualisieren.
 
Hier finden Sie die Hauptstartseiten:

Wenn Sie Fragen oder Probleme haben und sich mit uns in Verbindung setzen möchten, nutzen Sie am besten unsere Kontaktseite.

Mit herzlichen Grüßen

Ihr Team von wissenschaft-online
 
Science-Shop
Stephan Thesmann
Über die Kombination von guter Gestaltung und technischer Umsetzung »
 
Spektrum der Wissenschaft
Testen Sie drei aktuelle Ausgaben von Sterne und Weltraum zum Vorzugspreis von EUR 15,30 inkl. Versand. »
Die Spektrum CD-ROM enthält den kompletten Inhalt (inklusive Bilder) des Jahrgangs 2008 von Spektrum der Wissenschaft als PDF-Version. Zur besseren Nutzung Ihres Heftarchivs finden Sie auf der CD... »
 

DenkMal

Was sollte man besser immer im Auge behalten?
Grüner Elefant
Den gelben Fleck
Den roten Faden
Den Blauen Riesen
Den grünen Elefanten
top

Der selbst gebastelte Supercomputer

Wer ein großes, gewaltigen Rechenaufwand erforderndes Problem zu lösen hat, muss nicht unbedingt den modernsten, sündhaft teuren Parallelrechner in Anspruch nehmen. Mit geeigneter Verkabelung und Software tut es auch ein Haufen schrottreifer PCs.

Von William W. Hargrove und Forrest M. Hoffman und Thomas Sterling

Ein hungriger Wanderer kommt mit einem Kessel in ein armes Dorf und verspricht, er werde aus nichts weiter als einem glänzenden Stein und Wasser eine köstliche Suppe kochen. Mit ein wenig Kohl schmecke sie allerdings noch etwas besser … Zuerst sind die Dorfbewohner skeptisch, doch dann bringen sie kleine Gaben: einen Kohlkopf, ein Bündel Karotten, ein Stückchen Fleisch. Am Ende ist der Kessel mit genügend herzhafter Suppe gefüllt, um alle satt zu machen. Und die Moral von der Geschichte: Durch Kooperation kommen bedeutende Leistungen zu Stande, selbst mit bescheidenen und anscheinend unbedeutenden Zutaten.

So geht die Geschichte von der Steinsuppe, die in vielen Variationen erzählt wird. Und ausgerechnet in der Hochtechnologie wird dieses Märchen wahr: Aus Material, das andere Leute weggeworfen hätten, entstehen Supercomputer, also leistungsstarke Rechner, die Milliarden von Rechenoperationen pro Sekunde ausführen können.

Ein Supercomputer ist heute in der Regel ein Parallelrechner: Zahlreiche ultraschnelle Mikroprozessoren arbeiten gleichzeitig an der Lösung hochkomplexer Probleme wie der Vorhersage des Wetters oder der Simulation einer Kernwaffenexplosion (Hypercomputer (Teil I): "Auf dem Weg zum Billiarden-Rechner", Spektrum der Wissenschaft 1/2002, S. 78). Diese Rechner werden von renommierten Firmen wie IBM oder Cray hergestellt und kosten meist mehrere zehn Millionen Dollar - viel zu teuer für eine Forschungsgruppe mit bescheidenem Budget. Aus dieser Not machten Wissenschaftler an nationalen Forschungszentren und Universitäten in den letzten Jahren eine Tugend: Schließlich steckt in jedem billigen PC ein Mikroprozessor. Also übten sich die Wissenschaftler in der Kunst, durch geeignete Datenleitungen und Programme die vielen PCs so zusammenarbeiten zu lassen, als steckten sie alle im Gehäuse eines Superrechners.

Für zwei von uns (Hargrove und Hoffman) entstand der Bedarf an großer Rechenleistung 1996 bei unserer Arbeit am Oak Ridge National Laboratory (ORNL) in Tennessee. Wir wollten die Fläche der USA nach Ökoregionen kartieren, das heißt nach Gebieten gleicher Umweltbedingungen wie Klima, Oberflächengestalt und Bodenbeschaffenheit. Dazu teilten wir das Land (ohne die Inseln) in 7,8 Millionen quadratische Zellen ein, jede mit der Fläche von einem Quadratkilometer. Für jede Zelle mussten wir 25 Variablen berücksichtigen, von der durchschnittlichen monatlichen Niederschlagsmenge bis zum Stickstoffgehalt des Bodens. Ein einzelner PC oder eine Workstation hätte diese Aufgabe nicht bewältigen können. Wir benötigten einen Parallelrechner, und zwar einen, den wir uns leisten konnten!

Die Lösung unseres Problems fanden wir im Wortsinne auf dem Schrott. Wir bauten einen Verbund (einen computing cluster) aus veralteten PCs, die das ORNL ansonsten weggeworfen hätte, und nannten ihn Stone SouperComputer ("Steinsuppen/Super-Computer"), weil wir die Zutaten praktisch geschenkt bekommen hatten. Das Gerät war leistungsfähig genug, unsere Ökoregionen-Kartierung in unübertroffener Qualität zu bewältigen. Andere Forschungsgruppen haben dasselbe Bauprinzip noch wesentlich weiter getrieben: Ihre Rechencluster nehmen es an Leistung mit den besten Computern der Welt auf - für einen Bruchteil der Kosten. Dieses vorteilhafte Preis-Leistungs-Verhältnis hat bereits die Aufmerksamkeit einiger Unternehmen erregt, die so komplexe Aufgaben wie die Entschlüsselung des menschlichen Genoms mit Clustern angehen wollen (siehe auch den Beitrag auf Seite 94/95). Insgesamt verspricht das Konzept des Rechenclusters, das Hochleistungsrechnen zu revolutionieren, indem es praktisch jedem - Kleinunternehmen, Ingenieurbüro, Schule … - eine gewaltige Rechenleistung bietet.

Beowulf: der schmächtige Held unter den Supercomputern

Das Prinzip, Computer zu gemeinsamer Arbeit zu verkoppeln, ist nicht neu. Bereits in den fünfziger und sechziger Jahren schaltete die amerikanische Luftwaffe Computer, damals noch in Röhrentechnik, zu einem Raketen-Frühwarnsystem namens SAGE zusammen. Mitte der achtziger Jahre prägte die Digital Equipment Corporation (DEC) den Begriff "Cluster" für integrierte Systeme aus mittelgroßen VAX-Minicomputern. In der wissenschaftlichen Welt wurde es bald darauf üblich, Workstations, Computer, die in der Leistungsfähigkeit zwischen einem Minicomputer und einem PC liegen, zu vernetzen. Die Idee, Cluster aus PCs zu bauen, kam Anfang der Neunziger auf, einerseits weil deren massenproduzierte Mikroprozessoren so billig geworden waren, vor allem aber, weil die Kosten für das Ethernet, die Standard-Verbindungstechnik für lokale Netze, dramatisch gefallen waren.

Außerdem ebneten Fortschritte in der Software den Weg für PC-Cluster. In den Achtzigern hatte sich Unix als das dominierende Betriebssystem für wissenschaftliche und technische Berechnungen durchgesetzt. Die Betriebssysteme für PCs konnten allerdings mit dessen Leistungsfähigkeit und Flexibilität nicht mithalten. Da entwickelte 1991 ein finnischer Student namens Linus Torvalds im Alleingang ein Betriebssystem namens Linux, das ähnlich wie Unix arbeitete, aber auch auf PCs lief. Torvalds machte Linux kostenlos im Internet verfügbar, und schon bald begannen Hunderte von Programmierern Verbesserungen beizutragen. Mittlerweile ist Linux ein höchst populäres Betriebssystem für Einzelcomputer; aber es ist auch für Cluster ideal geeignet.

Der erste PC-Cluster entstand 1994 am Goddard-Raumflugzentrum der Nasa. Die Luft- und Raumfahrtbehörde suchte für die typischen Rechenprobleme der Erd- und Weltraumwissenschaft einen Rechner mit einer Leistung von einem Gigaflops, das sind eine Milliarde elementare Rechenoperationen pro Sekunde. Damals kostete jedoch ein kommerzieller Supercomputer dieser Größe ungefähr eine Million Dollar - zu viel, um ihn einer einzelnen Forschergruppe exklusiv zur Verfügung zu stellen.

Einer von uns (Sterling) entschied sich für das damals radikale Konzept, einen Rechencluster aus PCs zu bauen. Sterling und sein Kollege Donald J. Becker verbanden 16 PCs, die jeder einen Mikroprozessor vom Typ Intel 486 enthielten, unter dem Betriebssystem Linux mit der für lokale Netze üblichen Verkabelung, dem so genannten Ethernet. Bei wissenschaftlichen Anwendungen vollführte der Cluster im Dauerbetrieb 70 Millionen Gleitkommaoperationen pro Sekunde (70 Megaflops). Nach heutigen Maßstäben ist das nicht viel, kam aber der Leistung eines kleineren kommerziellen Supercomputers dieser Zeit schon ziemlich nahe, und das für ein Zehntel des Preises: nur 40000 Dollar.

Die Nasa-Forscher nannten ihren Cluster Beowulf, nach dem schmächtigen Helden einer frühmittelalterlichen Legende, der das riesige Monster Grendel besiegte, indem er ihm einen Arm ausriss. Seitdem hat sich Beowulf als Name für jeden kostengünstigen Cluster aus kommerziell verfügbaren PCs eingebürgert. Der ursprüngliche Cluster fand 1996 zwei Nachfolger: Hyglac am California Institute of Technology gemeinsam mit dem Jet Propulsion Laboratory in Pasadena und Loki am Nationallaboratorium in Los Alamos. Beide bestanden aus 16 Mikroprozessoren vom Typ Intel Pentium Pro und lieferten eine Dauerleistung von über einem Gigaflops bei Kosten von weniger als 50000 Dollar, womit eine Zielvorgabe der Nasa erreicht wurde.

Für unser Problem, die Kartierung der Ökoregionen der Vereinigten Staaten, war offensichtlich ein Parallelrechner das Mittel der Wahl. Eine einzelne Workstation konnte allenfalls die Daten einiger Bundesstaaten auf einmal verarbeiten, und Teilprobleme an getrennte Workstations zuzuweisen war nicht sinnvoll, da die Daten jeder Region mit denen jeder anderen Region in Beziehung zu setzen waren (siehe Kasten Seite 92/93). Also stellten wir 1996 einen Antrag auf 64 Pentium-II-PCs, um daraus einen Beowulf-Cluster zu bauen. Leider konnten wir die Gutachter am ORNL nicht überzeugen.

Eine digitale Ausschlacht-Werkstatt

Unverdrossen sannen wir auf Abhilfe. Wir wussten, dass veraltete PCs am Standort des Energieministeriums in Oak Ridge regelmäßig durch neuere Modelle ersetzt wurden. Die alten Geräte wurden auf einer internen Website angeboten; es stellte sich bald heraus, dass Hunderte von veralteten Computern ihrer Entsorgung harrten. Vielleicht könnten wir uns ja aus den Dingern, die niemand mehr haben wollte, einen Beowulf-Cluster basteln. Wir besorgten uns einen Raum im ORNL, der vorher einen veralteten Großrechner beherbergt hatte, und sammelten dort überzählige PCs.

Das Prinzip hinter der parallelen Verarbeitung ist "Teile und herrsche". Ein komplexes Problem ist in kleinere Teilaufgaben zu zerlegen. Jede Teilaufgabe wird dann einem "Rechenknoten" zugewiesen: einem Prozessor innerhalb des Parallelrechners oder eben einem der PCs in einem Beowulf-Cluster. Jeder Knoten arbeitet selbstständig an seinem Teilproblem und tauscht gelegentlich Zwischenergebnisse mit seinesgleichen aus.

Bei den heutigen technischen Gegebenheiten lautet die Grundregel: Rechnen geht schnell, aber Kommunikation ist mühsam. Man zerlege daher das Problem möglichst so, dass alle Knoten viel zu rechnen und wenig zu kommunizieren haben, also in Teilprobleme, die möglichst nur lose miteinander zusammenhängen. Wie weit das gelingt, hängt weitgehend von der Natur des Problems ab. Eine "feinkörnige" Zerlegung in sehr viele sehr kleine Teilprobleme gibt den Knoten wenig zu tun und viel zu reden, mit dem Ergebnis, dass sie sehr viel Zeit mit dem Warten auf Nachrichten verschwenden. Dagegen sind "grobkörnige" Probleme für die Verarbeitung mit Parallelrechnern weitaus besser geeignet.

Den vollständigen Artikel von William W. Hargrove und Forrest M. Hoffman und Thomas Sterling über "Der selbst gebastelte Supercomputer" finden Sie ab Seite 88 in der März-Ausgabe 2002 von Spektrum der Wissenschaft

   Home | Aktuelles Heft | Archiv | Sonderhefte | Abonnements  
szmtag
Spektrum der Wissenschaft - Homepage Inhaltsverzeichnis Archiv Rubriken Kontakt Spektrum der Wissenschaft Spektrum Archiv Spektrum Sonderhefte Abonnements / Service Aktuelles Heft