Diskové pole clusteru má celkovou kapacitu 12T . Pole je rozděleno na dvě části:

  • /usr/users/login - zálohovaný prostor
  • /usr/work/login - nezálohovaný prostor, určený pro data z výpočtů

Zde je několik zásad jak zacházet s vlastními daty, tak aby byl zachován efektivní výkon diskového pole a aby nebyl přetěžován zálohovací mechanismus:

    • Soubor ve vaší domácí složce ~/.nobackup.txt obsahuje seznam složek, které není nutné zálohovat. Editací tohoto souboru v libovolném textovém editoru můžete přidat vlastní složky, které nepotřebujete centrálně zálohovat. Zde doporučujeme vyvořit např. složku ~/Work ve které budete provádět výpočty a ukládat tam data výsledků a tuto složku zahrnete do seznamu ~/Work
      r0:~>cat .nobackup.txt 
      # Seznam adresaru a souboru (relativni cesta vuci domovskemu adresari),
      # ktere se NEBUDOU ZALOHOVAT pres rsync.
      ~/Mail/spam*
      
      # nezalohovat celou slozku ~/Work
      ~/Work
      
      # nezalohovat soubory *.vtu kdekoliv pod slozkou ~/Data 
      ~/Data/**/*.vtu
    • Z technických důvodů daných souborovým systémem používaném na diskovém poli je důležité omezit počet soborů v jedné složce na maximálně cca. 10000 souborů. Příkazem ls -shd Work/vypocet1 zjistíte velikost složky, která nezávisí na velikosti souborů v ní, ale čistě na počtu souborů.
      r0:~>ls -shd Work/drivencav
      264K Work/drivencav

      Tato velikost (zde 264K) by neměla překročit 1M.

  • Mazat nepotřebné soubory! - platí hlavně pro výsledky výpočtů, které víte že už nepotřebujete
  • Komprimovat soubory/složky s výsledky výpočtů:
    mám-li složku ~/Work/fenics/results a v ní soubory z časového výpočtu pak příkazem du -s -h ~/Work/fenics/results zjistím její velikost:

    r0:~/Work/fenics> du -s -h results/
    196M	results/

    pokud potřebuji výsledky uchovat pro pozdější zpracování provedu komprimaci následovně:

    r0:~/Work/fenics> tar -cvzf results.tar.gz results
    r0:~/Work/fenics> du -s -h results.tar.gz
    58M results.tar.gz

    při použití lepšího, ale pomalejšího kompresního algoritmu

    r0:~/Work/fenics> tar -cvJf results.tar.xz results
    r0:~/Work/fenics> du -s -h results.tar.xz
    11M results.tar.xz

    nakonec je třeba smazat původní data

    r0:~/Work/fenics> rm -r results

    Data mohu kdykoliv obnovit příkazem tar -xvzf results.tar.gz nebo tar -xvJf results.tar.xz

  • Užitečný příkaz pro vypsání obsahu složky setříděného podle toho kolik místa na disku zabírají všechny soubory a její podsložky:
    r0:~/Work> du -s -k * | sort -n
    8	guess_id
    16	Globals.mk
    5004	bender
    35532	bender_pressure
    100108	bingham_ale
    113976	git_repo
    117500	implicit
    649780	fenics