Zu Hauptinhalt springen
Gewählte Sprache ist Deutsch Select language
Startseite UR

Dokumentation

In dieser Kurzdokumentation finden sich alle relevanten Informationen für den schnellen Einstieg in das High Performance Computing auf dem Cluster der Universität Regensburg.

Weiterführende Informationen und detailliertere Materialien befinden sich in folgendem GRIPS-Kurs (momentan im Aufbau).

Allgemeine Verhaltensregeln

Beim Arbeiten in UNIX-nahen Systemen ist das Lesen von systemweit verfügbaren Befehlsdokumentationen grundsätzlich verpflichtend!

Der Login-Knoten athene1 dient ausschließlich zum Editieren/Kompilieren von Source Code, der Bearbeitung von Job-Input und Abschicken von Jobs. Ebenfalls erlaubt ist das Ausführen stärker I/O-lastiger, serieller Aufgaben, wie beispielsweise Datenkonvertierung.

Für Jobs sollten Ressourcen so angefordert werden, dass die Laufzeit mindestens 15 Minuten beträgt, mindestens 95 % der CPU-Zyklen genutzt werden und mindestens 80 % Arbeitsspeicher verwendet wird. Die Effizienz eines laufenden Jobs kann mit verschiedenen Befehlen überwacht werden (siehe GRIPS). Grobe Verstöße führen zur Limitierung der verfügbaren Ressourcen für zukünftige Jobs.

Das Benutzerverzeichnis (/home/abc12345) dient der Aufbewahrung von Job-Templates, Konfigurationsdateien etc., nicht jedoch für Rechnungen. Hierfür steht das parallele Dateisystem zur Verfügung (/beegfs/abc12345).

Queuing-System

Für das globale Jobmanagement steht PBS als Queuing-System zur Verfügung. Für den Einstieg relevante Befehle sind:

  • qsub <script> zum Abschicken von Jobs
  • qdel <jobid> zum Löschen abgeschickter/laufender Jobs
  • qstat zur Anzeige aktuell abgeschickter/laufender Jobs

PBS Job-Template

Als Basis für eigene Jobskripte kann das folgende "hello world"-Skript dienen:

Dokumentation2

Das Skript führt den Befehl echo auf zwei Knoten mit jeweils zwei Prozessen aus und schreibt das Ergebnis in den Standard Output-Stream.

1: Neben den öffentlichen Queues (serial, common und express) stehen verschiedenen Arbeitsgruppen dedizierte Queues zur Verfügung

2: Der Job beginnt seine Laufzeit im Home-Verzeichnis des jeweiligen Knotens. Mit dem Befehl wechselt der Job in das Verzeichnis, von dem dieser abgeschickt wurde.

3: Standard-Output wird in der Datei *.o<jobnummer> gesichert, Error-Output wird in der Datei *.e<jobnummer> gesichert.

Weiterführende Informationen zum Erstellen eigener Jobskripte, Beurteilung der Jobeffizienz und weiteren Themen (bei Bedarf auch spezielle von Benutzern angefragte Themen) befinden sich im GRIPS-Kurs.

  1. Universität