Übersicht

Hier finden Sie unsere am häufigsten gestellten Fragen. Bitte prüfen Sie, ob Ihre Frage hier beantwortet wird, bevor Sie eine Supportanfrage stellen. Die Fragen sind der Übersichtlichkeit halber nach Themenbereichen sortiert. Da sich einige Fragen auf zwei oder mehr Themenbereiche beziehen, sind sie in der Auflistung möglicherweise mehrfach enthalten.

Kategorien

HPC-Zugangsfragen

Wie viel kostet die HPC-Nutzung?Wie bei allen unseren Dienstleistungen wird auch die Nutzung unserer HPC-Ressourcen in Arbeitseinheiten (AE) abgerechnet. Die aktuellen Preise finden Sie im Dienstleistungskatalog: link. Ihre aktuelle Kontingentnutzung finden sie hier oder Sie melden sich bei login.gwdg.de an und verwenden Sie den Befehl kontingent.
Kann ich mit meinem Studentenkonto Zugang zu HPC erhalten?Nein, Sie können das HPC-System nicht mit einem Account nutzen, der zu der stud.uni-goettingen.de-Domäne gehört. Sie benötigen einen vollen GWDG-Account. Wenn Sie in der Universität, in der Max-Planck-Gesellschaft oder im Universitätsklinikum angestellt sind, haben Sie bereits einen “Einheitlichen Mitarbeiter-Account”. Falls nicht, wenden Sie sich bitte an support@gwdg.de für weitere Informationen oder füllen Sie das Antragsformular für einen Account zusammen mit Ihrem Vorgesetzten aus und senden Sie dann einen Aktivierungsantrag mit Ihrer GWDG-Benutzerkennung an support@gwdg.de.

HPC-Jobfragen

Das Limit von 120 Stunden (d.h. fünf Tage) Laufzeit ist zu gering, ich benötige eine längere Zeitspanne. Ist das möglich?Wir raten von Laufzeiten von mehr als fünf Tagen ab, da die Wahrscheinlichkeit eines Fehlers mit der Zeit zunimmt. Stattdessen empfehlen wir die Nutzung von Abhängigkeitsketten und Checkpoints. Wenn dies in Ihrem Fall nicht möglich ist, bitte wenden Sie sich an support@gwdg.de
Warum stürzt mein Programm mit `illegal instruction` ab?Wenn Ihr Programm mit illegal instruction-Fehlern abstürzt, sind diese manchmal hinter vielen anderen Fehlern versteckt. Dies ist in der Regel auf Unterschiede in der Prozessorarchitektur zwischen dem Rechner, auf dem der Code kompiliert wurde, und der Maschine, auf dem das Programm ausgeführt wurde, zurückzuführen. Genauer gesagt: Wenn Sie Ihren Code auf einem neueren System kompiliert haben, wie z.B. unseren Frontends gwdu101 und gwdu101, und versuchen, ihn auf einem der älteren Nodes auszuführen, wie z.B. den dmp- oder dfa-Nodes, wird er mit einem Fehler wie diesem fehlschlagen. Um dies zu vermeiden, fügen Sie entweder #SBATCH -C cascadelake zu Ihrem Jobscript hinzu, um es auf Knoten mit einem Cascade Lake-Prozessor zu beschränken, oder kompilieren Sie es auf unserem älteren Frontend gwdu103.
Wann wird mein Job starten?Sie können scontrol show job $JOBID | grep StartTime verwenden, um eine Approximation der Startzeit Ihres Auftrags zu erhalten. Diese Information ist jedoch nicht immer verfügbar.
Warum wird mein Job mit dem Ereignis `oom-kill` oder dem Handler `out-of-memory` beendet?Ihr Auftrag wird mit einer Meldung wie dieser beendet slurmstepd: error: Detected 1 oom-kill event(s) in StepId=[JOBID].batch cgroup. Some of your processes may have been killed by the cgroup out-of-memory handler. Das bedeutet, dass Ihrem Job der Speicher ausgegangen ist, d.h. dass Ihr Programm mehr Speicher/RAM verwendet hat, als Sie angefordert haben. Bitte fordern Sie mehr Arbeitsspeicher an.
Wieso starten meine Jobs mit "(QOSGrpCpuLimit)" nicht?Hängt ein Job mit dem Status pending (QOSGrpCpuLimit), sind aktuell alle verfügbaren Jobslots für diesen QoS in Benutzung. Es ist keine persönliche Beschränkung, sondern ein globales Limit. 1024 Cores können gleichzeitig im long-QoS genutzt werden. Sind diese in Benutzung müssen nachfolgende Jobs warten, bis genügend Cores frei sind.

Speicherfragen

Ich habe bald keinen Speicherplatz mehr. Wie kann ich meine Quota erhöhen?Bitte prüfen Sie, ob Sie Ihre Daten nach scratch, in das Archiv oder auf ein anderes System verschieben können. Wenn dies nicht möglich ist, schreiben Sie eine E-Mail an support@gwdg.de und bitten Sie um eine höhere Quota für Ihr $home. Sie können Ihre Quota jederzeit mit Quota auf den Frontend-Knoten überprüfen.
Warum kann ich nicht mehr in mein Home-Verzeichnis schreiben?Vielleicht ist Ihre Quota aufgebraucht. Sie können sich bei den Frontends anmelden und Ihre Quota mit Quota überprüfen. Wenn die Zahl unter used größer ist als die Zahl unter softlimit, haben Sie das softe Maximum überschritten, aber (vielleicht) noch nicht das absolute Maximum erreicht. Prüfen Sie, ob Sie einige Dateien nach /scratch, in das Archiv oder komplett aus den HPC-Systemen verschieben können. Wenn dies nicht der Fall ist, können Sie auch eine höhere Quota anfordern, indem Sie eine E-Mail an den Support schreiben.

Fragen bezüglich HPC-Anwendungen

Warum kann ich Gaussian nicht benutzen?Der Zugang zu Gaussian ist aufgrund von Lizenzanforderungen eingeschränkt. Um Ihr Konto für Gaussian freizuschalten, wenden Sie sich bitte an hpc@gwdg.de mit den folgenden Informationen: - Ihren Nutzernamen - Informationen zu Umfang, Größe (in Bezug auf die Molekülgröße oder die Anzahl der Basisfunktionen) und Berechnungsmethode (z.B. DFT/6-311G* Geometrieoptimierungen) Ihrer geplanten Berechnungen
Warum kann meine Software libcuda nicht finden?CUDA wird nur auf den GPU-Knoten verfügbar. Hier finden Sie alle Informationen dazu, wie Sie ein Batch-Skript für GPU-Knoten schreiben. Sollte das Problem weiterhin bestehen, kontaktieren Sie uns gerne per E-Mail
Wie kann ich Software (mit conda/mamba/micromamba) installieren?Exemplarisch zeigen wir hier, wie Sie Software mit Conda installieren können. Zunächst müssen Sie das zugehörige Modul laden: module load conda. Dann erstellen Sie eine neue Modulumgebung mit conda create --name <environment> und aktivieren diese mit conda activate <environment>. Innerhalb der Umgebung können Sie dann mit dem folgenden Befehl die Software installieren, welche Sie in dieser Umgebung haben möchten: conda install <software>. Wenn Sie möchten, dass diese Umgebung standardmäßig aktiviert wird, müssen Sie die Befehle module load conda und conda activate <environment> zu Ihrer .bashrc oder Ihrem .profile hinzufügen.
Wie kann ich Docker nutzen?Docker befindet sich nicht auf den Clustern, aber Docker-Container (ebenso wie OCI-Images) können in Singularity-Container umgewandelt werden, die auf den Clustern ausgeführt werden können und für HPC-Aufgaben besser geeignet sind (können z.B. auf Ihr HOME-Verzeichnis zugreifen). Führen Sie zunächst module load singularity aus, um Zugriff auf Singularity zu erhalten. Dann konvertieren Sie das Docker-Image in ein Singularity-Image mit singularity build SINGULARITY_CONTAINER_NAME docker://DOCKER_URL_TAG_ETC, wobei SINGULARITY_CONTAINER_NAME der Dateiname ist, den Sie für das konvertierte Image verwenden möchten, das traditionell die Erweiterung .sif hat. Wenn Sie einen bestehenden Container überschreiben müssen, fügen Sie die Option -F hinzu. Um das Singularity-Image zu starten, führen Sie singularity run SINGULARITY_CONTAINER_NAME aus, gefolgt von allen Kommandozeilenargumenten, die Sie übergeben möchten.
Wie kann ich Software mit Spack installieren?Mit ````spack-user können Sie Software installieren, die für die aktuell installierte Version verfügbar ist. Sie müssen zuerst das Modul mit ```module load spack-user laden, dann müssen Sie die Setup-Umgebung mit source $SPACK_USER_ROOT/share/spack/setup-env.sh`` erzeugen. Sie können dann die gewünschte Software mit spack install installieren und dann mit ```spack load <software> verwenden. Wenn Sie wollen, dass dieses Modul standardmäßig geladen wird, müssen Sie die Befehle module load spack-user``, source $SPACK_USER_ROOT/share/spack/setup-env.sh und ```spack load <software> zu Ihrer .bahsrc oder ```.profile`` hinzufügen.