URL dieses Artikels:

zu Ausgabe: 10.2002
Linux-Cluster sind im Kommen
Dr. Karsten Gaier von der science + computing AG
von Nadja Rosmann
Im Cluster-Bereich wird Linux immer mehr zur favorisierten Lösung, was nicht nur auf die Leistungsfähigkeit des Systems, sondern auch auf den wachsenden Kostendruck in der Industrie zurückzuführen ist. Die science + computing AG aus Tübingen betreut vor allem Linux-Cluster in der Automobilindustrie. Wir sprachen mit Vertriebs- und Marketingleiter Dr. Karsten Gaier über die wachsenden Einsatzmöglichkeiten von Linux im Computer Aided Engineering.

Linux Enterprise: Woher kommt die plötzliche Experimentierfreude in eher konservativen Branchen wie der Automobilindustrie im Hinblick auf Linux?
Dr. Karsten Gaier: Als Ende 1999 der erste Linux-Cluster in der Automobilindustrie in Betrieb genommen wurde, da war das ein mutiger Schritt, bei dem wir auch Überzeugungsarbeit geleistet haben. Heute sind Linux-Compute-Cluster (LCC) nicht mehr im Experimentierstadium sondern mit insgesamt über 1.400 CPUs in ca. 40 Clustern produktive Werkzeuge der Berechnungsabteilungen der Automobilhersteller und Zulieferer.
Die Möglichkeit Kosten bei der CPU-intensiven Berechnung zu sparen, ist natürlich der Hauptgrund für die starke Zunahme der Verbreitung von LCC. LCC kosten ca. zwei- bis dreimal weniger im Gegensatz zu herkömmlichen Unix-RISC-Compute-Servern bei vergleichbarer Leistung. Des weiteren ist der Bedarf an CPU-Zyklen in den Berechnungsabteilungen im Prinzip unersättlich und wird durch Methoden wie stochastische Crash-Analysen weiter angeheizt.
Die Verfügbarkeit und Stabilität von CAE-Applikationen (Computer Aided Engineering) unter Linux hat sich im Jahr 2001 sehr gebessert, sodass heute alle wichtigen Applikationen verfügbar sind.
Linux findet vermehrt auch als CAE-Desktop-Plattform Verwendung. Dies ermöglicht den Firmen die Nutzung preisgünstiger PC-Hardware bei gleichbleibenden Prozessen. Würde Windows eingesetzt, müssten in der Regel die Administrations- und Arbeits-Methoden angepasst werden. Windows-Applikationen können mit Emulatoren wie VMware nativ und performant unter Linux verwendet werden, sofern benötigt.

LE: Wenn man sich die Zahl der Linux-Cluster in der deutschen CAE-Industrie betrachtet, hat ja im zweiten Quartal 2001 ein rasantes Wachstum stattgefunden. Woran liegt das?
Gaier: Hier sind mehrere Gründe zu nennen. Das Vertrauen in Linux als Plattform für Compute-Cluster ist im Jahr 2001 vor allem durch erfolgreiche Referenzen deutlich gestiegen. Des weiteren nahmen Kostendruck und Bedarf an Rechenzeit stärker zu. Und nicht zuletzt haben die Software-Hersteller ihre zögernde Haltung gegenüber Linux - es steht ja kein großer Hardware-Vendor dahinter, der bei Problemen mit Portierung Unterstützung bietet - aufgegeben. Hier hat sicher auch die stetige Nachfrage seitens der Anwender eine Rolle gespielt.

LE: Wie haben sich die Systeme im Hinblick auf die Anzahl der Prozessoren verändert?
Gaier: Die mittlere Prozessorzahl der LCC-Systeme pro Quartal bewegte sich eine Weile um 40 bis 50 herum. Im ersten Quartal 2002 lag das Mittel bei 22 Prozessoren. Dies weist darauf hin, dass LCC immer mehr herkömmliche und kleinere RISC-Server ersetzen. Da der Preis für LCC um mindestens Faktor zwei niedriger ist, können die Abteilungen jetzt für die gleiche Investitionssumme deutlich leistungsstärkere Rechner beschaffen.

LE: An Universitäten ist Linux ja aus dem High Performance Computing schon nicht mehr wegzudenken. Projekte wie der Keppler Cluster oder der Chemnitzer Linux-Cluster wären wahrscheinlich mit proprietärer Software und der dafür nötigen Hardware kaum zu finanzieren gewesen. Sehen Industrieanwender den Linux-Einsatz im High Performance Computing auch unter diesem finanziellen Gesichtspunkt?
Gaier: Absolut - wie schon angeführt ist dies der Hauptgrund für den starken Anstieg der Verbreitung. Auch für die Industriekunden stellen Linux-Cluster die Möglichkeit dar, bisher nicht oder nur sehr schwer realisierbare Rechenzeit-Potenziale zu schaffen.

LE: Wie unterscheiden sich die Bedürfnisse und Anforderungen in der Industrie gegenüber denen an den Universitäten?
Gaier: Für die Industrie sind Aspekte wie Stabilität des LCC, sowie einfache Wartung und Administration, hohe Rechenleistung und Verfügbarkeit von Applikationen vordringlich. Im universitären Umfeld sind die Applikationen in der Regel eher von den Wissenschaftlern portiert und verfügbar. Für die Wartung und Administration werden von Unis in der Regel selbstentwickelte oder Public-Domain-Konzepte eingesetzt. Für die Industrie sind hier gewartete, eingeführte und möglichst effiziente Produkte wichtig, die auch verbreitet eingesetzt werden.
Wenn ein Berechnungs-Knoten im industriellen Cluster ausfällt, dann sollte dieser möglichst schnell wieder ersetzt oder voll-automatisch ein Ersatz-Knoten in die Berechnungen mit aufgenommen werden. In der universitären Umgebung sind diese Anforderungen in der Regel nicht so hart.

LE: Welchen Stellenwert nimmt Linux gegenwärtig in der CAE-Industrie ein?
Gaier: Linux nimmt an Bedeutung deutlich zu - sowohl im Server-Bereich als auch auf dem Desktop. Linux ist Enabler für Compute-Power bei bestem derzeit erhältlichen Preis-Leistungs-Verhältnis. Im High-End-Bereich der Berechnungen, wenn es um die so genannte Capability geht, sind Unix-Systeme mit hohen I/O-Leistungen und großem Adressierungsbereich weiterhin eine wichtige Komponente - im Bereich der Berechnungen für den Durchsatz, wenn also Capacity gefordert ist, sind Linux-Cluster ganz klar im Kommen.
Für den CAE-Desktop setzen Firmen wie z.B. Porsche auf Linux. Hier gibt es durch die vielen Hardware-Komponenten im PC-Bereich Bedarf für abgestimmte Lösungen - s+c hat zusammen mit Porsche einen Standard-Desktop entwickelt. Hierbei überzeugt unter anderem die überraschend hohe grafische Performanz der Applikationen.

LE: Wie reagieren die Anbieter entsprechender Branchensoftware auf die wachsende Nachfrage nach Linux als Plattform?
Gaier: Inzwischen haben alle wichtigen CAE-Software-Anbieter Linux im Programm. Im CAD-Bereich sieht das noch anders aus - die Verfügbarkeit von wichtigen CAD-Applikationen wie z.B. Catia beschränkt sich im PC-Bereich bisher auf Windows.

LE: In welchen Bereichen werden Linux-Cluster in der CAE-Industrie vor allem eingesetzt?
Gaier: Wichtige Einsatzgebiete für LCC sind die Strömungsberechnung (CFD) mit derzeit ca. 25 Clustern sowie die Crash-Berechnungen mit ca. neun in der Regel deutlich größer dimensionierten Clustern. Der größte Cluster mit 384 CPUs findet sich in der Crash-Berechnung. Weitere LCC sind in der Festigkeitsberechnung sowie elektromagnetischen Kompatibilitäts-Untersuchung und Giess-Simulation im Einsatz, wie aus der von s+c alle drei Monate erneuerten Übersicht zum Thema LCC im CAE-Umfeld hervorgeht (siehe www.science-computing.de).

LE: Wie unterscheiden sich die Anforderungen im Hinblick auf Administration und Wartung von Linux-Clustern gegenüber anderen Soft- und Hardwareplattformen?
Gaier: Bei bisherigen SMP-Systemen mit vielen CPUs ist ein Betriebssystem zu verwalten. Beim LCC hat man es mit vielen unabhängigen Linux-Betriebssystemen zu tun, was eine ganz andere Strategie für die Administration erfordert. Hier ist es wichtig, parallelisiert im Cluster Installationen und Änderungen hinsichtlich Software sowie Konfiguration der Knoten durchführen zu können.
Fällt ein Knoten aus, dann sollte ersetzte Hardware wieder installiert und in den Cluster integriert werden und zwar möglichst vollautomatisch. Auch die Hinzunahme des reparierten Knotens in den Job-Ablauf sollte automatisiert erfolgen.
Für die in der Vergangenheit eingesetzten Unix-Server wurde aufgrund des monolithischen Systems eine hohe Verfügbarkeit des Gesamtsystems von 99,X Prozent gefordert, was sich natürlich auch im Preis niedergeschlagen hat. Die Ansprüche an die Verfügbarkeit gelten natürlich auch für den LCC, sind aber in diesem Fall mit deutlich günstigerer Hardware bei entsprechenden Konzepten genauso zu erfüllen. Wichtige Komponenten sind in diesem Fall Ersatz-Knoten, die automatisch in den Jobablauf aufgenommen werden sowie ein entsprechend konfiguriertes Batch-System, das abgebrochene Jobs selbstständig wieder aufsetzt.
Was immer wieder deutlich wird: Auf der Hardware-Seite kann man viel sparen, aber auf der Administrationsseite muss man mehr Aufwand treiben, um eine ähnlich elegante Administration wie für herkömmliche SMP-Server zu realisieren.

LE: In wie weit werden Linux-Cluster-Projekte in der Automobilindustrie von den Unternehmen in Eigenregie umgesetzt? Wann und warum kommen externe Experten ins Spiel?
Gaier: Die großen Firmen wie Audi, DaimlerChrysler, BMW oder MTU setzen auf die Unterstützung von externen Firmen. science + computing z.B. betreibt derzeit 14 Cluster mit insgesamt mehr als 900 CPUs und hat dafür das s.cluster-Konzept zur möglichst effizienten Verwaltung von LCC entwickelt.
Kleinere Cluster in der Zulieferindustrie werden entweder gemeinsam mit einem externen Partner realisiert oder in Zusammenarbeit mit einem erfahrenen Hardwareanbieter wie Fujitsu-Siemens gestaltet. Hierbei zeigt die Erfahrung, dass auch für kleinere Cluster im Hinblick auf eine effiziente Administration entsprechende Software-Werkzeuge sehr hilfreich sind.
Oft ist in Firmen jeglicher Größe noch wenig Linux-Know-how vorhanden. science +computing bietet aus diesem Grund schlüsselfertige LCC-Lösungen mit einer optionalen Garantie für den zukünftigen Betriebsaufwand an.

LE: Wie sieht das s.cluster-Konzept von science + computing aus?
Gaier: Für eine möglichst effiziente Administration und Wartung reduziert das s.cluster-Konzept die Installation neuer oder ausgetauschter Hardware auf das Anschalten der Hardware. Ist diese nicht installiert, dann wird vollautomatisch Linux mit allen notwendigen Komponenten und gegebenenfalls Patches sowie die Applikationssoftware installiert und konfiguriert.
Nachfolgende Änderungen wie SW-Updates oder Konfigurationen werden mit der VENUS-s.cluster-Edition im laufenden Betrieb durchgeführt. Das s.cluster-Konzept ist so ausgelegt, dass keinerlei Konfigurationen hinsichtlich MAC-Adressen oder ähnlichem durchzuführen sind, damit nach dem Anschalten eines neuen Knotens nach ca. 15 Minuten dieser voll verfügbar ist.

LE: Wie wird sich der Bereich Linux-Cluster Ihrer Meinung nach in den nächsten zwei Jahren entwickeln?
Gaier: Die Zahl der LCC im CAE-Umfeld wird in der nächsten Zeit zügig zunehmen. In einem oder eineinhalb Jahren werden Neuanschaffungen für CAE-Compute-Lösungen hauptsächlich in Richtung LCC getätigt werden, sodass in ca. zweieinhalb bis drei Jahren 75 Prozent der Berechnungsleistung von LCC abgedeckt werden. Im Bereich der Applikationen mit großen Hauptspeicheranforderungen wird die IA-64-Plattform eine wichtige Rolle spielen. Weitere wichtige Einsatzgebiete von LCC sind im Moment in der Life Science-Industrie sowie in der Erdöl-Exploration zu finden.

LE: Welche Anforderungen ergeben sich aus dem industriellen Einsatz von Linux-Clustern an die Kernel-Entwicklung?
Gaier: Wichtige Aspekte sind die professionelle Unterstützung von Mehrprozessor-Systemen sowie 64-Bit-Architekturen, sobald sie in breitem Maße im PC-Umfeld zur Verfügung stehen. Ein wichtiger Punkt neben der Kernel-Entwicklung ist auch die Verschiedenheit der Linux-Distributionen, die sowohl von den Applikations-Herstellern als auch in der Administration unterstützt werden müssen.

Unser Gesprächspartner
Dr. Karsten Gaier ist Vertriebs- und Marketingleiter der science + computing AG. Seine Karriere bei s+c hat der theoretische Astro-Physiker 1993 als Software-Entwickler begonnen und anschließend den Vertrieb der Workload-Management-Software LSF übernommen. Derzeit setzt er einen Schwerpunkt im Bereich Linux-Cluster und erstellt eine regelmäßig erscheinende Übersicht über Linux-Cluster im CAE-Umfeld. Vorher war Karsten Gaier unter anderem als Software-Entwickler für Automobilzulieferer tätig.

Das Unternehmen
Die science + computing ag (s+c) ist ein kombiniertes Dienstleistungs- und Softwarehaus für technisch-wissenschaftliche Konstruktions- und Simulationsumgebungen (CAD/CAE/CAT und Forschung). s+c konzentriert sich auf die Gestaltung von offenen und verteilten Systemen und hat jahrelange Erfahrung im Betrieb und der Administration von komplexen, heterogenen Unix-, Linux- und NT-Umgebungen. Mit Venus hat s+c ein Produkt im Bereich der Systemadministration entwickelt, das höchste Performance, größtmögliche Verfügbarkeit, hohe Datentransparenz und -sicherheit für den professionellen IT-Service-Provider bereitstellt. Mit diesem Tool wird auch eine Integration von Unix- und NT-basierten Systemen im technischen Umfeld möglich. Weitere Informationen finden Sie unter www.science-computing.de/.

© 2004 Software & Support Verlag GmbH. Vervielfältigung nur mit Genehmigung des Verlags. Fragen?