Der Hochleistungsrechner Athene der Universität Regensburg existiert seit
nunmehr 12 Jahren, natürlich nicht mehr in seiner ursprünglichen
Hardwarekonfiguration. Zur ersten Athene-Generation steuerten wir eigentlich
nur das Konzeptpapier bei, HW-Design und Softwarestack wurden damals
eingekauft. Im Zuge der Zeit wurden aber zur Flexibilitätssteigerung die
proprietären Softwarekomponenten durch offene Lösungen ersetzt. Im letzten
Durchlauf für unsere jüngste HW-Generation nahmen wir uns aber Allem selbst
an - lediglich die HW-Komponenten wurden von einem HW-Distributor
beigebracht, so daß sich unser HPC-Verbund unseren Anwendern quasi wie aus
einem Guss stammend präsentiert.
Athene vereint derzeit Hardware aus drei Architekturgenerationen. Eine
detailierte Übersicht findet sich auf den Status-Seiten. Benutzt man bspw. die
zuletzt beschafften 468 Broadwellknoten zum gemeinsamen Lösen eines
linearen Gleichungssystems mit 2,7 Millionen Unbekannten, dann belegt die Matrix gut 53 TiB RAM und weitere 2,5 TiB für IO-Puffer. Nach nur 11 Stunden Rechnen steht das Ergebnis bereit - die Knoten haben damit ⅓ PFLOP/s verrichtet.
Im Gegensatz zu anderen Clusterarten, wie bspw. Hochverfügbarkeitsverbünde mit einfachem FIFO-Scheduling, sollten im HPC-Umfeld bestromte Rechenressourcen nie brach liegen. Da wir Informatiker gern alles optimieren und leider ziemlich schnell Probleme in unserem Queuing-System/Scheduler Gespann (Torque/Maui) deutlich wurden, die keine Vollauslastung bei reichlich wartender Arbeit zur Folge hatten; sich Nutzer beim Job-Dimensionieren aber an der Komplexitätsklasse des genutzten Lösungsalgorithmus sowie der Problemgröße selbst orientieren dürfen sollten und obere Schranken nur durch die verfügbare Hardware vorgegeben werden, entstanden in freizeitlicher Eigenleistung diverse kleinere Analysetools und als deren Ergebnis von Maui losgelöste selbstregulierende Schedulingpfade. Damit erreicht Athene problemlos 98% gemittelte Auslastung bei moderaten Wartezeiten. Nur Infrastrukturarbeiten an unserer Stromzufuhr bzw. Klimaanlage bedingen Auszeiten, ansonsten steht Athene stets zur Stelle.
Athenes Anwendungsschwerpunkte werden durch die vor Ort ansäßigen
Lehrstühle und deren Forschungsbestrebungen bestimmt und sind wie im
HPC-Umfeld schon fast üblich in der Quantenchemie/-physik, der Hochenergiephysik und in letzter Zeit auch zunehmend meßbar in den Lebenswissenschaften zu suchen. Die große Mehrzahl unserer Nutzer sind dabei eigentlich nur Anwender, die verfügbare Solver parametrisiert zur Lösung ihrer Probleme nutzen. Mit unserer neuen Fakultät für Informatik wird sich dies aber sicherlich rasch ändern. Die Expertise im Umgang mit besagten Problemlösern obliegt bei den Lehrstühlen, die diese in der Regel in eigenen Kursen weitergeben. Natürlich unterstützen wir unsere Kollegen auch beim Erzeugen optimierter Kompilate noch nicht integrierter wissenschaftlicher Anwendungen für unsere HPC-Architektur. Zugangsberechtigt sind alle UR Wissenschaftler, aber auch UR Studenten im Rahmen eines angegliederten Kurses oder einer Abschlußarbeit.
Sind unsere vor Ort verfügbaren Ressourcen nicht ausreichend bzw. bzgl. ihrer Architektur unpassend, dann finden sie eventuell Hilfe beim Kompetenznetzwerk für wissenschaftliches Höchstleistungsrechnen.
Hauptanliegen von KONWIHR ist es, die Nutzung von Hoch- und Höchstleistungsrechnern fachlich zu unterstützen und deren Einsatzpotential durch Forschungs- und Entwicklungsvorhaben auszuweiten. Hierbei wird auf eine enge Zusammenarbeit zwischen Grundlagendisziplinen, Anwendern und beteiligten Rechenzentren sowie auf effizienten Transfer und schnelle Anwendung der Ergebnisse Wert gelegt. Gefördert werden können Kurse, Forschungsprojekte, Tagungen und Präsentationen.
Gefördert werden Projekte an bayerischen Hochschulen und Universitäten. Die Förderung bemisst sich an der Dauer des Vorhabens und kann maximal 10.000 € (kleines Projekt mit drei Monaten) bzw. bis 50.000 € für Projekte mit zwölf Monaten Laufzeit betragen.
Die Projekte sind in enger Kooperation mit einem der beiden Rechenzentren (LRZ/RRZE) durchzuführen. Insbesondere soll der/die geförderte Projektmitarbeiter/in einen längeren Zeitraum (etwa 50% der Projektdauer) an einem der beiden Zentren verbringen, um so direkt auf die dortige HPC-Expertise zurückgreifen können. Für Antragsteller außerhalb der Standorte Erlangen und München/Garching kann auf Antrag ein Zuschuss zu den Reise- und Aufenthaltskosten gewährt werden.
Projektanträge (etwa zwei Seiten bei kleinen Projekten; ansonsten max. fünf Seiten) können jederzeit per Mail an info@konwihr.de
bei der KONWIHR-Geschäftsstelle eingereicht werden. Sie werden jedoch nur in halbjährlichem Turnus (Stichtag jeweils zum 1.3. und 1.9.) begutachtet.
Vor der Antragstellung wird generell eine Kontaktaufnahme mit einem der beiden Rechenzentren dringend empfohlen, damit die Verfügbarkeit von Mitarbeitern und Spezialwissen sichergestellt ist. Anträge sind vom federführenden Wissenschaftler/in einzureichen und werden hinsichtlich wissenschaftlicher Qualität und Einpassung in die Fördermaßnahmen extern evaluiert.
M. Brehm (Leibnitz-Rechenzentrum)
T. Zeiser (Regionales Rechenzentrum Erlangen)
doku.lrz.de/display/PUBLIC/High+Performance+Computing
hpc.fau.de/systems-services/systems-documentation-instructions