Na clusteru je instalován SLURM manažer front úloh. Jeho ovládání je vysvětleno na zvláštní stránce.

Volba Fronty

Pro předání úlohy clusteru k provedení je zároveň nutné vybrat i frontu úloh, do které se Váš úkol zařadí. K výběru jsou tyto:

  1. express3
  2. long3
  3. express, short, long are deprecated

Volba se provádí pomocí -p fronta například

#SLURM -p express3

Fronta express3

Tato fronta omezuje běh úlohy na 6 hodin reálného času. Je jedno, zda běží úloha paralelně na mnoha procesorech, nebo pouze na jednom. Tato fronta je frontou implicitní - pokud tedy nezvolíte žádnou, bude vybrána tato. Fronta má přednost před ostatními frontami a úloha v ní zařazená může běžet na libovolném výpočetním nodu.

Fronta short

Tato fronta omezuje běh na 48 hodin reálného času. Úloha v ní zařazená může běžet na všech strojích s vyjímkou stroje r1.

Fronta long3

Tato fronta je určena pro časově náročnější úlohy: běh úlohy je omezen na 7 dní. Ovšem tato fronta má vymezenou jen část clusteru: nody r44-r47. Aby nebyly úlohy zde diskriminovány, mají přednost před úlohami z fronty short (pokud se sejde požadavek na stroj, kde může běžet short i long úloha).

UserFairPolicy

SLURM zároveň sleduje, kolik má který uživatel požadavků na výpočety ve frontě a snaží se uživatele "spravedlivě" dělit o volné procesory. Pokud má uživatel X ve frontě 10 úloh a uživatel Y zadá ke spuštění 2, pak budou spouštěny v tomto pořadí: X1, Y1, X2, Y2, X3, ..., X10.

Další omezení

Oproti předchozímu queuing systému zde nezavádíme omezení na počty úloh, které může běžet konkrétní uživatel. Věříme, že vyvažování zátěže pomocí UserFairPolicy dokáže obsloužit větší počet uživatelů.

InfiniBand

Výpočetní nody r1-r5,r7,r21-r27 jsou vzájemně propojeny optickou sítí InfiniBand, která ma propustnost až 40 GB/s. Pokud počítáte paralelní úlohy s distribuovanou pamětí (MPI), volte přednostně tyto výpočetní nody. Do Vašeho Slurm souboru přidejte následující omezení:

#SBATCH --constraint="InfiniBand"

a o zbytek se postará jak SLURM (který se bude snažit vybrat jen tyto nody), tak mpirun, který přednostně nastaví MCA modul openib.