COMPUTE CLUSTER
Startseite
Geschichte
Zugang
Hardware
Benchmarks
Software
Batchsystem
Jobklassen
|
Nutzung des Batchsystems
Für alle speicher- und zeitintensiven Rechenjobs im Cluster ist die
Verwendung des Batchsystems zwingend notwendig.
Als Batchsystem wird die Sun Grid Engine eingesetzt
(Nachfolger von Codine).
Das System verwaltet Warteschlangen für alle Compute Server
entsprechend deren Ressourcenausstattung und verteilt die abgeschickten Jobs auf einen passenden Rechner.
Wichtigstes Kriterium für die Verteilung von Jobs ist die Definition von
Jobklassen.
Submit Script
Das Abschicken von Jobs erfolgt über ein kurzes Script, welches beispielsweise
wie folgt aussieht:
#$ -l class_L # Jobklasse (u.a. Anforderungen)
#$ -N testjob # Name des Jobs
#$ -e /dev/null # keine Fehlerausgabe
#$ -o /dev/null # keine Standardausgabe
#$ -m n # keine Mails
#$ -cwd # Aufruf im akt. Verzeichnis
cd /home/testuser/gaussian # Wechsel in Verzeichnis
/home/optapps/g09/gau test # Programmaufruf mit Input
Alle Zeilen, die mit #$ beginnen, werden vom Batchsystem als Optionen für den
jeweiligen Job eingelesen.
Nach diesen Zeilen folgt der eigentliche Aufruf des Programms in gewohnter Weise mit allen notwendigen Parametern.
Dieses Script wird üblicherweise als eigene Datei gespeichert, z.B. als "Lgauss".
Bei Bedarf kann man verschiedene Scripts z.B. für verschiedene Jobklassen und
Programme anlegen, so daß immer nur Input-Name zu ändern ist.
Mit dem Kommando qsub XLgauss erfolgt nun im genannten Beispiel das Abschicken
("Submit") des Jobs.
Für einige besonders häufig genutzte Anwendungen stehen ausführbare
Kommandos zur Verfügung, die das Anlegen und Editieren eines eigenen Scripts
überflüssig machen.
Diese Kommandos dürfen nicht mit einem fertigen Script verwechselt werden !
Derzeit sind direkt aufrufbar ( /usr/local/bin ):
- Mg09, MKg09, Lg09, LKg09, VLg09, XLg09 (GAUSSIAN 09 für verschiedene Jobklassen)
- Mg03, MKg03, Lg03, LKg03, VLg03 (GAUSSIAN 03 für verschiedene Jobklassen)
- Mgms, MKgms, Lgms, LKgms, VLgms, XLgms (GAMESS 2009 für verschiedene Jobklassen)
- Mmop, MKmop, Lmop, LKmop, VLmop (MOPAC 2000 für verschiedene Jobklassen)
Der komplette Submit-Vorgang erfolgt in diesen Fällen z.B. durch:
Lg09 testjob
wobei die Inputdatei "testjob" den entsprechenden Extender haben muß, bei
Gaussian z.B. ".com" .
Jobverteilung und -verwaltung
Die Verteilung der Jobs auf die Maschinen erfolgt je nach freien Queues in der
jeweiligen Jobklasse.
Jobs haben umso geringere Priorität, je mehr Jobs des Nutzers bereits laufen.
Die Priorität innerhalb der Jobs eines Benutzers ist standardmäßig
immer gleich, dies kann aber vom Benutzer verändert werden (entweder beim
Abschicken ("qsub") oder bei bereits in der Schlange wartenden
Jobs durch das "qalter"-Kommando.
Achtung: Ohne oder mit falscher Angabe einer Jobklasse im Submit-Script
wird der Job in die Schlange eingereiht, wird aber niemals anlaufen !
Die wichtigsten Kommandos sind:
- qsub: Abschicken von Jobs
- qdel: Löschen von Jobs
- qstat: Anzeige aller laufenden und wartenden Jobs
- qhost: Anzeige aller Maschinen und Auslastung
Außer dieser vollständig über die Kommandozeile abzuwickelnden Befehle
existiert ein graphisches Interface ("qmon") für die Nutzung unter XWindows.
Voraussetzungen für die Nutzung
- Account für das Compute Cluster
- Rechte für die jeweiligen Queues
- Eingerichtete Umgebung:
source /home/sge60/chemie/common/settings.csh (csh) bzw.
. /home/sge60/chemie/common/settings.sh (ksh),
dadurch wird auch der Pfad zu den Befehlen (qsub, qstat, ...) gesetzt.
Der o.g. Aufruf sollte sinnvollerweise im Login-Script eingefügt werden.
|
AKTUELLES
KONTAKT
Dr. Matthias Mann

Walther-Hempel-Bau
Mommsenstr. 4
Raum 210
Tel.: +49 351 463-34286
Fax: +49 351 463-37224
Mobil: +49 351 463-42746
E-Mail: Matthias.Mann@chemie.tu-dresden.de
Post:
TU Dresden
Fakultät Mathematik und
Naturwissenschaften
Fachrichtung Chemie
und Lebensmittelchemie
01062 Dresden
Pakete:
TU Dresden
Fakultät Mathematik und
Naturwissenschaften
Fachrichtung Chemie
und Lebensmittelchemie
Helmholtzstraße 10
01069 Dresden
|