- De
- En
Hier finden Sie unsere am häufigsten gestellten Fragen. Bitte prüfen Sie, ob Ihre Frage hier beantwortet wird, bevor Sie eine Supportanfrage stellen. Die Fragen sind der Übersichtlichkeit halber nach Themenbereichen sortiert. Da sich einige Fragen auf zwei oder mehr Themenbereiche beziehen, sind sie in der Auflistung möglicherweise mehrfach enthalten.
login.gwdg.de
an und verwenden Sie den Befehl kontingent
.illegal instruction
-Fehlern abstürzt, sind diese manchmal hinter vielen anderen Fehlern versteckt.
Dies ist in der Regel auf Unterschiede in der Prozessorarchitektur zwischen dem Rechner, auf dem der Code kompiliert wurde, und der Maschine, auf dem das Programm ausgeführt wurde, zurückzuführen.
Genauer gesagt: Wenn Sie Ihren Code auf einem neueren System kompiliert haben, wie z.B. unseren Frontends gwdu101 und gwdu101, und versuchen, ihn auf einem der älteren Nodes auszuführen, wie z.B. den dmp- oder dfa-Nodes, wird er mit einem Fehler wie diesem fehlschlagen.
Um dies zu vermeiden, fügen Sie entweder #SBATCH -C cascadelake
zu Ihrem Jobscript hinzu, um es auf Knoten mit einem Cascade Lake-Prozessor zu beschränken, oder kompilieren Sie es auf unserem älteren Frontend gwdu103.scontrol show job $JOBID | grep StartTime
verwenden, um eine Approximation der Startzeit Ihres Auftrags zu erhalten. Diese Information ist jedoch nicht immer verfügbar.slurmstepd: error: Detected 1 oom-kill event(s) in StepId=[JOBID].batch cgroup. Some of your processes may have been killed by the cgroup out-of-memory handler.
Das bedeutet, dass Ihrem Job der Speicher ausgegangen ist, d.h. dass Ihr Programm mehr Speicher/RAM verwendet hat, als Sie angefordert haben. Bitte fordern Sie mehr Arbeitsspeicher an.(QOSGrpCpuLimit)
, sind aktuell alle verfügbaren Jobslots für diesen QoS in Benutzung. Es ist keine persönliche Beschränkung, sondern ein globales Limit. 1024 Cores können gleichzeitig im long-QoS genutzt werden. Sind diese in Benutzung müssen nachfolgende Jobs warten, bis genügend Cores frei sind.scratch
, in das Archiv oder auf ein anderes System verschieben können. Wenn dies nicht möglich ist, schreiben Sie eine E-Mail an support@gwdg.de und bitten Sie um eine höhere Quota für Ihr $home
. Sie können Ihre Quota jederzeit mit Quota
auf den Frontend-Knoten überprüfen.Quota
überprüfen. Wenn die Zahl unter used
größer ist als die Zahl unter softlimit
, haben Sie das softe Maximum überschritten, aber (vielleicht) noch nicht das absolute Maximum erreicht. Prüfen Sie, ob Sie einige Dateien nach /scratch
, in das Archiv oder komplett aus den HPC-Systemen verschieben können. Wenn dies nicht der Fall ist, können Sie auch eine höhere Quota anfordern, indem Sie eine E-Mail an den Support schreiben.Conda
installieren können. Zunächst müssen Sie das zugehörige Modul laden: module load conda
. Dann erstellen Sie eine neue Modulumgebung mit conda create --name <environment>
und aktivieren diese mit conda activate <environment>
. Innerhalb der Umgebung können Sie dann mit dem folgenden Befehl die Software installieren, welche Sie in dieser Umgebung haben möchten: conda install <software>
. Wenn Sie möchten, dass diese Umgebung standardmäßig aktiviert wird, müssen Sie die Befehle module load conda
und conda activate <environment>
zu Ihrer .bashrc
oder Ihrem .profile
hinzufügen.module load singularity
aus, um Zugriff auf Singularity zu erhalten. Dann konvertieren Sie das Docker-Image in ein Singularity-Image mit singularity build SINGULARITY_CONTAINER_NAME docker://DOCKER_URL_TAG_ETC
, wobei SINGULARITY_CONTAINER_NAME
der Dateiname ist, den Sie für das konvertierte Image verwenden möchten, das traditionell die Erweiterung .sif
hat. Wenn Sie einen bestehenden Container überschreiben müssen, fügen Sie die Option -F
hinzu. Um das Singularity-Image zu starten, führen Sie singularity run SINGULARITY_CONTAINER_NAME
aus, gefolgt von allen Kommandozeilenargumenten, die Sie übergeben möchten. können Sie Software installieren, die für die aktuell installierte Version verfügbar ist. Sie müssen zuerst das Modul mit ```module load spack-user
laden, dann müssen Sie die Setup-Umgebung mit source $SPACK_USER_ROOT/share/spack/setup-env.sh`` erzeugen. Sie können dann die gewünschte Software mit
spack install installieren und dann mit ```spack load <software>
verwenden. Wenn Sie wollen, dass dieses Modul standardmäßig geladen wird, müssen Sie die Befehle module load spack-user``,
source $SPACK_USER_ROOT/share/spack/setup-env.sh und ```spack load <software>
zu Ihrer .bahsrc
oder ```.profile`` hinzufügen.