User Tools

Site Tools


wiki:uso_sist

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
wiki:uso_sist [2022/10/06 20:31]
cnr-guest [Preparazione e sottomissione di job]
wiki:uso_sist [2025/05/26 12:49] (current)
scopeadmin
Line 23: Line 23:
 Tra alcuni mesi l'accesso al cluster avverrà  esclusivamente tramite il metodo "utente - SSH Key" (altri metodi di accesso sicuro sono allo studio).\\ Tra alcuni mesi l'accesso al cluster avverrà  esclusivamente tramite il metodo "utente - SSH Key" (altri metodi di accesso sicuro sono allo studio).\\
 Gli utenti attuali sono invitati a generare la coppia di chiavi e caricare la chiave pubblica sul server nella loro home.\\ Gli utenti attuali sono invitati a generare la coppia di chiavi e caricare la chiave pubblica sul server nella loro home.\\
-I nuovi utenti, quando chiederanno un account, seguiranno una procedura leggermente differente: essi genereranno la coppia di chiavi, ma non cariccheranno la chiave pubblica sul server (non avranno ancora accesso): essi la manderanno all'admin Ibisco.  L'admin la copierà, con i corretti permessi, nella home del nuovo utente. Dopodiché l'utente avrà l'abitlià di entrare nel sistema senza inserire una password del server (ma avrà ancora da inserire una passphrase, v. avanti).\\+I nuovi utenti, quando chiederanno un account, seguiranno una procedura leggermente differente: essi genereranno la coppia di chiavi, ma non caricheranno la chiave pubblica sul server (non avranno ancora accesso): essi la manderanno all'admin Ibisco.  L'admin la copierà, con i corretti permessi, nella home del nuovo utente. Dopodiché l'utente avrà l'abitlià di entrare nel sistema senza inserire una password del server (ma avrà ancora da inserire una passphrase, v. avanti).\\
 Una volta entrato, l'utente creerà una password per il server con yppasswd per l'accesso a tutti i nodi del cluster.\\ Una volta entrato, l'utente creerà una password per il server con yppasswd per l'accesso a tutti i nodi del cluster.\\
  
Line 71: Line 71:
  
 Documentazione approfondita su Lustre è reperibile in rete, al link: ''https://www.lustre.org/'' Documentazione approfondita su Lustre è reperibile in rete, al link: ''https://www.lustre.org/''
 +
 +''/ibiscostorage''
 +nuova area scratch condivisa tra UI e nodi di calcolo (disponibile dal 07/10/2022), **non** basata su Lustre
  
  
Line 76: Line 79:
 ==== Preparazione e sottomissione di job ==== ==== Preparazione e sottomissione di job ====
  
-=== Premessa: nuove regole di gestione dei job attive dal 9/10/2022 ===+=== Premessa: nuove regole di gestione dei job attive dal 10/05/2025 ===
  
 Per migliorare l'uso delle risorse sono state cambiate le regole di gestione dei job. Per migliorare l'uso delle risorse sono state cambiate le regole di gestione dei job.
Line 86: Line 89:
       * che non usano le GP-GPU,       * che non usano le GP-GPU,
       * per un numero totale di job su di essa in esecuzione non superiore a 128       * per un numero totale di job su di essa in esecuzione non superiore a 128
 +      * e limite massimo del tempo di esecuzione pari a 1 settimana
 +    - Coda **htc**:
 +      * accetta solo job paralleli con numero di nodi uguale ad 1,
 +      * che facciano uso di non più 1 GP-GPU
       * e limite massimo del tempo di esecuzione pari a 1 settimana       * e limite massimo del tempo di esecuzione pari a 1 settimana
     - Coda **parallel**:     - Coda **parallel**:
Line 100: Line 107:
       * e limite massimo del tempo di esecuzione pari a 1 giorno       * e limite massimo del tempo di esecuzione pari a 1 giorno
  
-Dal 9 ottobre sarà disabilitata la coda corrente e saranno attive solo quelle definite qui, da selezionare in modo esplicito. Ad esempio, per sottomottere un job nella coda **parallel** eseguire\\+Ad esempio, per sottomottere un job nella coda **parallel** eseguire\\
  
   $ srun -p parallel <ALTRE OPZIONI> <NOME COMANDO>   $ srun -p parallel <ALTRE OPZIONI> <NOME COMANDO>
Line 112: Line 119:
 SLURM è un sistema software open source per la gestione di cluster; è altamente scalabile, offre meccanismi di fault-tolerance e di scheduling di jobs. SLURM è un sistema software open source per la gestione di cluster; è altamente scalabile, offre meccanismi di fault-tolerance e di scheduling di jobs.
  
-=== Concetti base di SLURM ===+==== Concetti base di SLURM ====
  
 Le componenti principali di SLURM sono: Le componenti principali di SLURM sono:
Line 137: Line 144:
 Un elenco completo dei comandi disponibili si trova nel man (disponibile anche online all’indirizzo ''https://slurm.schedmd.com/man_index.html''): ''man <cmd>'' Un elenco completo dei comandi disponibili si trova nel man (disponibile anche online all’indirizzo ''https://slurm.schedmd.com/man_index.html''): ''man <cmd>''
  
-=== Esempi di uso di alcuni dei comandi base ===+==== Esempi di uso di alcuni dei comandi base ====
  
 == Informazione su sistema e risorse == == Informazione su sistema e risorse ==
wiki/uso_sist.1665088269.txt.gz · Last modified: 2022/10/06 20:31 by cnr-guest