This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
wiki:uso_sist [2022/08/04 23:10] cnr-guest |
wiki:uso_sist [2023/06/14 16:31] (current) cnr-guest |
||
---|---|---|---|
Line 23: | Line 23: | ||
Tra alcuni mesi l' | Tra alcuni mesi l' | ||
Gli utenti attuali sono invitati a generare la coppia di chiavi e caricare la chiave pubblica sul server nella loro home.\\ | Gli utenti attuali sono invitati a generare la coppia di chiavi e caricare la chiave pubblica sul server nella loro home.\\ | ||
- | I nuovi utenti, quando chiederanno un account, seguiranno una procedura leggermente differente: essi genereranno la coppia di chiavi, ma non cariccheranno | + | I nuovi utenti, quando chiederanno un account, seguiranno una procedura leggermente differente: essi genereranno la coppia di chiavi, ma non caricheranno |
Una volta entrato, l' | Una volta entrato, l' | ||
Line 71: | Line 71: | ||
Documentazione approfondita su Lustre è reperibile in rete, al link: '' | Documentazione approfondita su Lustre è reperibile in rete, al link: '' | ||
+ | |||
+ | ''/ | ||
+ | nuova area scratch condivisa tra UI e nodi di calcolo (disponibile dal 07/ | ||
==== Preparazione e sottomissione di job ==== | ==== Preparazione e sottomissione di job ==== | ||
+ | |||
+ | === Premessa: nuove regole di gestione dei job attive dal 9/10/2022 === | ||
+ | |||
+ | Per migliorare l'uso delle risorse sono state cambiate le regole di gestione dei job. | ||
+ | |||
+ | * Sono state implementate nuove politiche di utilizzo basate su meccanismi di // | ||
+ | * Sono state definite nuove code per la sottomissione dei job | ||
+ | - Coda **sequential**: | ||
+ | * accetta solo job sequenziali con numero di task non superiore ad 1, | ||
+ | * che non usano le GP-GPU, | ||
+ | * per un numero totale di job su di essa in esecuzione non superiore a 128 | ||
+ | * e limite massimo del tempo di esecuzione pari a 1 settimana | ||
+ | - Coda **parallel**: | ||
+ | * accetta solo job paralleli con numero di task superiore ad 1 e minore di 1580, | ||
+ | * che facciano uso di non più 64 GP-GPU | ||
+ | * e limite massimo del tempo di esecuzione pari a 1 settimana | ||
+ | - Coda **gpus**: | ||
+ | * accetta solo job che facciano uso di non più di 64 GP-GPU, | ||
+ | * con numero di task minore di 1580 | ||
+ | * e limite massimo del tempo di esecuzione pari a 1 settimana | ||
+ | - Coda **hparallel**: | ||
+ | * accetta solo job paralleli con numero di task superiore a 1580 e minore di 3160, | ||
+ | * che facciano uso di almeno 64 GP-GPU | ||
+ | * e limite massimo del tempo di esecuzione pari a 1 giorno | ||
+ | |||
+ | Dal 9 ottobre sarà disabilitata la coda corrente e saranno attive solo quelle definite qui, da selezionare in modo esplicito. Ad esempio, per sottomottere un job nella coda **parallel** eseguire\\ | ||
+ | |||
+ | $ srun -p parallel <ALTRE OPZIONI> <NOME COMANDO> | ||
+ | |||
+ | Se il job non è conforme alle regole della coda usata, sarà terminato. | ||
+ | |||
+ | === Uso delle risorse === | ||
Per usare le risorse del cluster è installato nel sistema il gestore di risorse SLURM. Documentazione approfondita su esso è disponibile al link '' | Per usare le risorse del cluster è installato nel sistema il gestore di risorse SLURM. Documentazione approfondita su esso è disponibile al link '' | ||
Line 80: | Line 115: | ||
SLURM è un sistema software open source per la gestione di cluster; è altamente scalabile, offre meccanismi di fault-tolerance e di scheduling di jobs. | SLURM è un sistema software open source per la gestione di cluster; è altamente scalabile, offre meccanismi di fault-tolerance e di scheduling di jobs. | ||
- | === Concetti base di SLURM === | + | ==== Concetti base di SLURM ==== |
Le componenti principali di SLURM sono: | Le componenti principali di SLURM sono: | ||
Line 105: | Line 140: | ||
Un elenco completo dei comandi disponibili si trova nel man (disponibile anche online all’indirizzo '' | Un elenco completo dei comandi disponibili si trova nel man (disponibile anche online all’indirizzo '' | ||
- | === Esempi di uso di alcuni dei comandi base === | + | ==== Esempi di uso di alcuni dei comandi base ==== |
== Informazione su sistema e risorse == | == Informazione su sistema e risorse == | ||
Line 355: | Line 390: | ||
* Per usare la finestra comandi di Matlab, usare '' | * Per usare la finestra comandi di Matlab, usare '' | ||
* Configurare l' | * Configurare l' | ||
+ | * Si può accedere a Matlab versione R2022a usando il comando '' | ||
== configurazione ed esecuzione == | == configurazione ed esecuzione == | ||
Line 362: | Line 398: | ||
{{: | {{: | ||
- | // Il file devre essere decompresso prima dell' | + | // Il file deve essere decompresso prima dell' |
Affinché al cluster acceda un programma Matlab, l' | Affinché al cluster acceda un programma Matlab, l' | ||
Line 399: | Line 435: | ||
a(i) = max(abs(eig(rand(A)))); | a(i) = max(abs(eig(rand(A)))); | ||
end | end | ||
+ | delete(mypool); | ||
+ | quit | ||
</ | </ | ||
- | Per eseguire questo codice, è possibile utilizzare il seguente | + | Per eseguire questo codice, è possibile utilizzare il seguente |
- | < | + | < |
- | #SBATCH --nodes=1 | + | / |
- | #SBATCH --ntasks-per-node=5 | + | </ |
- | / | + | |