URL dieses Artikels:

zu Ausgabe: 02.2003
Grid Computing ist der nächste Hype
Tom Schwaller von IBM
von Nadja Rosmann
Grid Computing gehört zu den gegenwärtig spannendsten Themen im Enterprise und Scientific Computing. Wir sprachen mit Tom Schwaller, Linux-IT-Architekt bei IBM, über den momentanen Entwicklungsstand der Grid-Technologien, über die Einsatzmöglichkeiten von Grid Computing und über die Strategien, die IBM in diesem Segment verfolgt.


Linux Enterprise: Herr Schwaller, Grid Computing gehört zu den großen Schlagworten im Enterprise und Scientific Computing. Was verbirgt sich hinter dem Begriff?
Tom Schwaller: Grid Computing möchte die gesamten IT-Ressourcen wie Server, Storage und Applikationen virtualisieren. Eine ähnliche Idee verfolgt IBM bei den klassischen Mainframes schon seit langem, allerdings geht Grid Computing noch weiter, weil es Hardware- und Betriebsystem-unabhängig ist. Man unterscheidet dabei je nach Anwendungszweck zwischen Rechen-, Daten-, Service- oder Intelligenten Grids. Bei ersteren wird ähnlich wie bei Clustern die Rechenleistung der einzelnen Maschinen zusammengefasst, um ein für einen einzelnen Knoten unlösbares Problem zu knacken. Daten-Grids erinnern entfernt an SANs und dienen dazu, verteilte Speicherkapazitäten gemeinsam verfügbar zu machen. Man denke etwa an radioastronomische Daten, die weltweit an diversen Standorten erfasst und zu einem RadioGrid verschmolzen werden. Service-Grids wiederum erinnern im weitesten Sinne an verteilte Applikationen auf Basis von CORBA oder J2EE. Intelligente Grids beinhalten schließlich alle anderen Grid-Typen und verwalten sich autonom. Mehr zu Grids findet man übrigens im entsprechenden IBM Redpaper. Bei der Realisierung von Grids ist natürlich das Thema Sicherheit sehr wichtig. Wenn man nämlich Ressourcen oder in Zukunft Grid-basierte Web Services über das Internet freigibt, so will man sicher sein, dass sie nur von autorisierten Personen in klar definiertem Umfang verwendet werden können. Die technische Grundlage des Ganzen ist derzeit das Globus Toolkit.

LE: In welcher Beziehung stehen Grid Computing und P2P-Technologien? Wo liegen Verwandschaften, wo Unterschiede?
Schwaller: Die Ideen sind durchaus ähnlich, wobei Grid Computing weit über das im P2P-Bereich oft vertretene klassische File Sharing (ein simples Daten-Grid) hinausgeht.

LE: Und welche Beziehungen bestehen zwischen Grid-Technologien und Web Services?
Schwaller: Diese beiden Ideen sind nicht direkt verwandt, lassen sich aber sehr gut verbinden (was ja im Moment mit der Open Grid Service Architecture passiert). Web Services sind mehr oder weniger statische Applikationen, die sich mit XML-basierten Protokollen übers Web (HTTP) abfragen lassen. Ein gutes Beispiel ist etwa Google, welches seit geraumer Zeit einen Web Service für Suchabfragen bereitstellt. Die dahinter laufende Applikation könnte zum Beispiel auf einem Grid ablaufen (derzeit ist es ein Linux-Cluster mit mehreren Tausend PCs).

LE: Welches waren bisher die wichtigsten Schritte in der Evolution des Grid Computings?
Schwaller: Grundlage waren all die Technologien, die letztendlich zum Internet in seiner jetzigen Form geführt haben: Vernetzung, Bereitstellen von Content und schließlich Web Services. Die Erfahrungen, die man beim Bau von Clustern gemacht hat, flossen natürlich auch implizit ins Grid Computing mit ein. Und was man nicht vergessen sollte, ist die visionäre Vorausschau der Probleme im zukünftigen Umgang mit gigantischen Datenmengen und lokal nicht vorhandenen Rechen- und Speicherkapazitäten. Kein Wunder, dass das CERN in der Nähe von Genf einer der Väter des Grid Computings ist. Dringend notwendig wäre auch der Übergang von IPv4 zu IPv6, um einige notorische Sicherheitsprobleme an der Wurzel zu packen.

LE: Betrachten wir die technischen Details: welche Protokolle, Standards und Tools sind für das Grid Computing relevant?
Schwaller: Die Basis bilden Standard-Internet-Protokolle. Wichtig ist das Framework, das die Ressourcen verteilt. Manche Leute sagen ja, dass wir bisher nur ein riesiges Batchjob-Framework haben. Das war sicherlich am Anfang so. Aber man muss natürlich auch sehen, dass noch viele Entwicklungsschritte notwendig sind. Besonders wichtig ist der Bereich Security, denn ohne ein vernünftiges Identitätsmanagement, Sicherheitspolicies, PKI und vieles mehr wäre es fahrlässig, ein Grid in einem öffentlichen Netz zu betreiben. In der nächsten Globus-Version 3.0, die 2003 erscheint, werden Web Services und Themen wie SOAP, WSDL, digitale XML-Signaturen und XML-Verschlüsselung eine zentrale Rolle spielen, welche alle unter dem Oberbegriff OGSA (Open Grid Service Architecture) zusammengefasst wurden.

LE: Wie ist die Open Grid Service Architecture (OGSA) aufgebaut?
Schwaller: OGSA ist eine XML-basierte Softwarearchitektur, die Grid Computing mit Web Services verbindet und aus einer Vielzahl von Software-Komponenten besteht (SOAP, SWDL, ...). Die Referenz-Implementierungen basieren derzeit auf Java, beim Zugriff auf die Grid-basierten Web Services kann natürlich jede beliebige Programmiersprache verwendet werden, die mit XML umgehen kann (Perl, Python, PHP, Ruby, C#, ...). Auch hierzu wird ein Redbook von IBM erscheinen.

LE: Wer ist für die Entwicklung der OGSA zuständig? Und welche Rolle spielt IBM hier?
Schwaller: Für die OGSA-Entwicklung ist das Globus-Konsortium zuständig, an dem die verschiedensten Unternehmen und Universitäten beteiligt sind. Das Thema Grid Computing haben sich mittlerweile alle Serverhersteller auf die Fahnen geschrieben und neben IBM sind auch viele Firmen, die im Bereich High Performance Computing und Linux-Cluster engagiert sind, am Thema Grid interessiert. Insgesamt handelt es sich um eine industrieweite Initiative, wobei IBM durch die Größe der Investitionen bedingt, ein gewichtiges Wort mitreden wird.

LE: Welches sind die wichtigsten Werkzeuge des Globus Toolkits?
Schwaller: Das Toolkit beinhaltet zum Beispiel Werkzeuge, um Jobs in einem Grid abzusetzen. Aus Anwendungssicht braucht man eigentlich nicht viel mehr zu wissen. Da die Installation des Globus-Toolkits ein bisschen haarig sein kann, stellt IBM vorkompilierte Pakete für Linux und AIX bereit, um dem Benutzer den Einstieg zu erleichtern. Daneben gibt es Werkzeuge für den Umgang mit Security und in Zukunft auch Web Services. All das könnte man natürlich mit Sockets oder einer Bibliothek wie MPI selber programmieren, aber wozu? Man hat immer noch genug Arbeit, seine eigene Software Grid-fähig zu machen. Ein Beispiel für eine portierte Software ist etwa Cactus, welche Ende 1998 bei der WDR-Computernacht für astrophysikalische Berechnungen verwendet wurde.

LE: Können Sie ein paar Grid-Beispielprojekte darstellen, die IBM bereits realisiert hat?
Schwaller: Es gibt bei IBM diverse interne Grid-Projekte, auf denen jeder interessierte IBMer Erfahrungen sammeln kann und die zum Teil auch produktiv eingesetzt werden. Zusätzlich gibt es verschiedene nationale Forschungs-Grids an denen IBM beteiligt ist. Im Prinzip hat jedes Land, das im Bereich High Performance Computing etwas auf sich hält, Grid-Projekte (TeraGrid, BioGrid, ...) mit wissenschaftlichen Anwendungen aus der Physik, Biologie oder Chemie am Laufen. So betreibt etwa die Universität von Pennsylvania federführend ein Mammographie-Grid für die Brustkrebsforschung. Ein anderes interessantes Projekt ist das Spiele-Grid butterfly.net, welches für Millionen von Spielern ausgelegt ist und sehr gut zeigt, was man alles mit dieser Technologie anstellen kann.

LE: Welche Rolle spielt Grid Computing für die Strategie von IBM? Welche Produkte und Services gibt es bereits, welche sind mittelfristig geplant?
Schwaller: IBM hat vor ein paar Wochen angekündigt, zehn Milliarden US-Dollar in das so genannte onDemand Computing zu investieren, bei dem IT-Dienstleistungen (Rechenpower, Applikationen, ...) analog zu Strom, Wasser oder Gas bei Bedarf bezogen werden können. Grid Computing bildet hierbei eine der technischen Grundlagen und wird zusammen mit Resultaten aus dem Bereich des Autonomic Computing mittel- und kurzfristig in IBMs Hardware-, Software- und Service-Portfolio integriert werden. So kann sich etwa die neue DB2-Version 8.1 selbst tunen und wird in Zukunuft mit anderen IBM-Software-Produkten Grid-fähig sein.
Für das Globus-Toolkit wird es zudem nächstes Jahr eine WebSphere- (und auch JBoss-) basierte OGSA-Implementierung (Globus 3.0) geben, mit der Web Services intelligent verwaltet werden können und auf Hardware-Ebene kommen in jeder neuen IBM Server-Generation immer mehr selbstheilende Features hinzu. Man sieht also, dass Grid Computing und damit zusammenhängende Themen - unter anderem auch Linux - im Zentrum der strategischen Überlegungen von IBM stehen.

LE: Welchen Entwicklungsweg wird Grid Computing in den nächsten Jahren nehmen? Für welche Anwendergruppen, die die Technologien bisher noch nicht nutzen, werden diese interessant werden?
Schwaller: Innovative Grid-Software wird zu neuen Szenarien führen, die man sich heute noch gar nicht vorstellen kann und zusammen etwa mit Linux-Entwicklungen beim Blue Gene Supercomputer-Projekt die Grenze des Machbaren immer weiter nach oben treiben. Bereits heute ist auf Platz fünf der Top 500 ein Linux-Cluster anzutreffen! Um sich auf breiter kommerzieller Front durchzusetzen und neue Anwenderkreise zu erschließen, muss Grid-Computing sein Versprechen einlösen, die Informationstechnologie radikal zu vereinfachen. Dies wird man daran messen können, ob sich private Anwender ihre eigenen Grids aufbauen werden, so wie dies bereits in vereinfachter Form im P2P-Bereich mit Seti@home geschehen ist.

LE: Vielen Dank für das Gespräch.

Unser Gesprächspartner
Tom Schwaller ist Linux-IT-Architekt bei IBM und entwickelt technische Konzepte für den Einsatz von Linux. Die Bandbreite an Themen umfasst alles, was sich heute mit Linux realisieren und mit dem IBM-Portfolio abbilden lässt.

Das Unternehmen
IBM ist einer der weltweit größten Anbieter im Bereich Informationstechnologie (Hardware, Software und Services) und weltweit aktiv in eBusiness-Lösungen. IBM und Partner bieten ihren Kunden die komplette Produktpalette an fortschrittlicher Informationstechnologie an. Vor zwei Jahren machte das Unternehmen mit einer Milliardeninvestition in Linux von sich reden. Die nächsten großen Entwicklungen scheinen sich nun im Bereich Grid Computing zu vollziehen. Weitere Informationen zur Grid-Strategie von IBM finden sich unter www-1.ibm.com/grid/index.shtml.

Links

© 2004 Software & Support Verlag GmbH. Vervielfältigung nur mit Genehmigung des Verlags. Fragen?