[inizio] [indice generale] [precedente] [successivo] [indice analitico] [contributi]

171. Trasferimento e sincronizzazione di dati attraverso la rete

A fianco del problema della realizzazione di una riproduzione speculare di informazioni pubblicate sulla rete, c'è anche quello di gestire un sistema di copia remota tra elaboratori, per dati che non sono messi a disposizione del pubblico, soprattutto allo scopo di mantenerli allineati.

Per questo tipo di problema, non avrebbe senso utilizzare il protocollo FTP, come sarebbe necessario per un sito speculare standard. Piuttosto, si fa uso di script o programmi che si basano sui servizi di una shell per l'accesso remoto, come rsh o ssh (capitoli 87 e 188).

171.1 Rdist

Rdist è un sistema di copia che permette di mantenere l'allineamento di uno o più elaboratori (host), mantenendo le informazioni relative alla proprietà, ai permessi e alla data di modifica dei file coinvolti.

L'aggiornamento dei dati si basa sul confronto delle date di modifica e delle dimensioni dei file. In linea di principio, non conta il fatto che i dati siano più recenti o meno, basta che siano diversi. Naturalmente, è possibile istruire Rdist in modo che aggiorni solo i file più recenti, così come si possono definire altri dettagli.

L'operazione di allineamento delle copie parte dall'elaboratore che contiene i dati originali, contattando i vari nodi presso cui si trovano le copie da allineare. In questo senso va inteso il nome di Rdist: Remote DISTribution, ovvero, distribuzione remota.

171.1.1 Principio di funzionamento

Rdist si avvale di due eseguibili per stabilire il collegamento necessario al trasferimento dei dati da allineare: rdist dalla parte dell'elaboratore utilizzato come punto di partenza per la distribuzione dei file (l'origine), e rdistd dalla parte degli elaboratori contenenti le copie da allineare (le destinazioni).

Tuttavia questo non basta. È necessario anche l'uso di rsh, e l'accesso remoto relativo deve essere configurato in modo che l'utente, generalmente root, possa accedere agli elaboratori da allineare senza l'inserimento di alcuna password.

In pratica, si utilizza rdist per ordinare l'allineamento dei dati; questo utilizza rsh per connettersi con uno degli elaboratori remoti coinvolti, allo scopo di avviare lì il programma rdistd. Quindi, attraverso la connessione tra rdist e rdistd, ottenuta per mezzo di rsh, avviene la verifica delle corrispondenze e il trasferimento dei dati necessari.

Dalla descrizione fatta, dovrebbe essere chiaro che Rdist non è un servizio di rete, nel senso che non esiste un demone in ascolto su una certa porta TCP/IP. Rdist si avvale del servizio reso da rsh, che da solo (probabilmente anche con rcp) non basterebbe a risolvere il problema dell'allineamento delle copie remote.

171.1.2 Origine e destinazione

Generalmente, quando si indicano i dati da allineare, si fa riferimento a un'origine, rappresentata da un percorso del filesystem locale, e a una destinazione composta semplicemente dal nome del nodo. In questa situazione, si intende che il percorso indicato come origine sia lo stesso nel filesystem del nodo di destinazione.

Per esempio, se si vuole allineare la directory /tmp/prove/ciao/ del filesystem locale, con il nodo remoto linux.brot.dg, e non si specifica una directory remota, si intende che debba trattarsi della stessa anche in quel filesystem.

Se invece si specifica anche la directory remota, la destinazione diventa esplicita, e così, questa può essere anche una posizione diversa da quella del nodo di origine.

171.1.3 Modalità di distribuzione

Prima ancora di vedere come si utilizza e si configura Rdist, è utile analizzare alcune delle modalità di funzionamento. La loro conoscenza permette di comprendere le possibilità di Rdist, e il senso di ciò che si fa.

Come si vedrà meglio più avanti, la modalità di funzionamento viene definita attraverso una o più parole chiave, fornite per mezzo dell'opzione -o. Segue l'elenco di alcune di queste parole chiave.

verify
Non effettua alcun allineamento di dati, si verifica solo che i dati siano allineati. Se non lo sono, si ottiene l'elenco di ciò che andrebbe aggiornato.
whole
Se si specifica una directory remota, la modalità whole fa sì che nella directory di destinazione venga riprodotto tutto il percorso originale.
Per esempio, utilizzando la modalità whole, se si vuole allineare la directory /tmp/prove/ciao/ del filesystem locale, con il nodo remoto linux.brot.dg nella directory /tmp/, si otterrà la directory /tmp/tmp/prove/ciao/.
younger
Fa in modo che vengano aggiornati solo i dati che nell'origine risultano avere una data di modifica più recente.
compare
Fa in modo che vengano aggiornati solo i file che differiscono nel contenuto. Per determinarlo, i file vengono comparati in modo binario, e se risultano diversi, avviene la modifica nelle copie da allineare.
ignlnks
Fa in modo che venga ignorato il problema dei collegamenti simbolici che non sono risolti. In pratica, con questa modalità i collegamenti vengono riprodotti tali e quali, anche se puntano a qualcosa che non c'è.
chknfs
Ignora la verifica e l'allineamento dei dati che nel nodo di destinazione risultano collocati in un filesystem di rete (NFS).
chkreadonly
Ignora la verifica e l'allineamento dei dati che nel nodo di destinazione risultano collocati in un filesystem montato in sola lettura.
chksym
Fa in modo di tollerare i collegamenti simbolici nella destinazione. In pratica, se nella destinazione i file o le directory sono spostati rispetto all'origine, e per mantenere uniformità appaiono dei collegamenti, questi non vengono rimossi, ma si accetta la variazione locale.
quiet
Riduce la quantità di messaggi. Per la precisione non segnala i file che vengono aggiornati.
remove
Elimina i file estranei. Se viene aggiornata una directory intera, i file che si trovano già nella destinazione, e non sono presenti nell'origine, vengono rimossi.
nochkowner
Non verifica l'utente proprietario per i file che esistono già nella destinazione. La proprietà dell'utente viene modificata solo se il file richiede un aggiornamento per altri motivi.
nochkgroup
Non verifica il gruppo proprietario per i file che esistono già nella destinazione. La proprietà del gruppo viene modificata solo se il file richiede un aggiornamento per altri motivi.
nochkmode
Non verifica i permessi per i file che esistono già nella destinazione. I permessi vengono modificati solo se il file richiede un aggiornamento per altri motivi.
nodescend
Fa in modo che le directory vengano trattate come file normali, senza allineare anche il loro contenuto e le sottodirectory eventuali.
numchkowner
L'allineamento delle copie è fatto in modo che i file nella destinazione abbiano lo stesso numero UID di quelli dell'origine. Quando non si utilizza questa modalità, Rdist fa in modo che i file abbiano lo stesso nominativo-utente, utilizzando il numero UID necessario in base alla configurazione del nodo di destinazione.
numchkgroup
L'allineamento delle copie è fatto in modo che i file nella destinazione abbiano lo stesso numero GID di quelli dell'origine. Quando non si utilizza questa modalità, Rdist fa in modo che i file abbiano lo stesso nominativo di gruppo, utilizzando il numero GID necessario in base alla configurazione del nodo di destinazione.
savetargets
Nel caso in cui dei file nella destinazione debbano essere sostituiti, questi vengono salvati con l'estensione .OLD. Se esistono già copie di sicurezza di questo tipo, queste vengono sovrascritte, e non vengono rinominate ulteriormente.

171.1.4 Configurazione

Le operazioni da compiere con Rdist possono essere inserite in un file di configurazione. Se attraverso le opzioni non si fa riferimento a qualcosa di diverso, o comunque non si vuole ignorare questo file, il nome predefinito è distfile, oppure, in sua mancanza, Distfile, collocato nella directory corrente.

La struttura di questo file di configurazione è un po' strana. Come accade spesso, il simbolo # introduce un commento che termina alla fine della riga; inoltre, le righe vuote sono ignorate.

All'interno del file è possibile dichiarare delle variabili, attraverso le quali, il resto delle direttive può diventare più semplice da leggere. La loro dichiarazione avviene in direttive che utilizzano la sintassi seguente:

<nome-variabile> = <valore>

La loro espansione avviene con la notazione seguente, dove le parentesi graffe sono necessarie per fare in modo che il nome della variabile venga preso in considerazione per intero (diversamente si utilizzerebbe solo il primo carattere).

${<nome-variabile>}

Nelle direttive che definiscono l'allineamento tra origine e destinazione, si fa spesso riferimento a elenchi di nomi. Questi possono essere indicati raggruppandoli attraverso l'uso di parentesi tonde, come mostrato nella sintassi seguente:

<nome> | ( [<nome> [<nome>]...] )

Come si vede, quando l'elenco è formato da un nome soltanto, non occorrono parentesi, anche se queste si possono usare comunque. L'elenco tra parentesi è spaziato semplicemente, senza bisogno di altri simboli di separazione, e inoltre è possibile indicare l'elenco nullo.

Questi raggruppamenti possono essere assegnati a delle variabili che successivamente possono essere usate per rappresentarli. In questo senso, si possono eseguire delle operazioni elementari che si richiamano vagamente alla teoria degli insiemi.

<elenco> + <elenco>

<elenco> - <elenco>

<elenco> & <elenco>

La prima espressione restituisce un elenco che contiene tutti gli elementi dei due elenchi; in pratica, rappresenta l'unione dei due. La seconda restituisce un elenco contenente gli elementi presenti nel primo insieme, che non si trovano nel secondo. La terza restituisce l'intersezione dei due insiemi, cioè un elenco di elementi presenti in entrambi i raggruppamenti.

Gli elenchi di file possono essere definiti attraverso caratteri jolly, ma solo quando questi sono riferiti all'elaboratore locale (quello di origine). Sono ammissibili i caratteri jolly della shell C (csh); in pratica sono validi: l'asterisco (*), il punto interrogativo (?), le parentesi quadre e le parentesi graffe, con lo stesso significato che hanno anche con la shell Bash.

Il tipo di direttiva più importante è quello che definisce l'allineamento di un gruppo di file o directory nell'origine con un gruppo di nodi di destinazione. Anche se la sintassi seguente mostra una struttura scomposta su più righe, in realtà tutto potrebbe apparire su una riga sola, a discapito della leggibilità.

[<etichetta>:] <origine> -> <destinazione> [<comando>;]...

L'etichetta è un nome facoltativo, terminato da due punti (:), a cui si può fare riferimento per selezionare un gruppo ristretto di azioni; l'origine è un elenco di file e directory; la destinazione è un elenco di nodi rappresentati per nome o attraverso l'indirizzo IP, con l'eventuale aggiunta di un prefisso costituito dal nominativo-utente da utilizzare per l'accesso remoto; infine, i comandi sono delle indicazioni aggiuntive che definiscono in particolare l'operazione da compiere e permettono di stabilire delle modalità dell'allineamento dei dati.

La destinazione può essere composta da un elenco di nomi che rispettano la sintassi seguente. L'utente, rappresenta il nome utilizzato per l'accesso attraverso rsh.

[<utente>@]<host>

I comandi possono essere di tipo differente e così utilizzano sintassi differenti. Segue un elenco di questi comandi che verranno descritti nelle sezioni seguenti.

install
Copia dei file e delle directory che, in base alle modalità specificate (o predefinite), richiedono aggiornamento.
except
Esclude un gruppo di file e directory dalle operazioni che altrimenti avrebbero luogo in base agli altri comandi.
except_pat
Esclude un gruppo di file e directory, indicato attraverso l'uso di espressioni regolari, dalle operazioni che altrimenti avrebbero luogo in base agli altri comandi.
notify
Invia un messaggio attraverso la posta elettronica, contenente le operazioni compiute.
special
Esegue un comando nell'elaboratore remoto, dopo l'aggiornamento di un file.
cmdspecial
Esegue un comando nell'elaboratore remoto, dopo l'esecuzione di tutte le operazioni.

171.1.4.1 install

install [-o<elenco-modalità>] [<destinazione>]

Copia dei file e delle directory che, in base alle modalità specificate (o predefinite), richiedono aggiornamento. Le modalità possono essere indicate come appare nella sintassi: precedute da -o, proseguendo con un elenco dei nomi di modalità che si vogliono attivare. Questo elenco è staccato semplicemente utilizzando la virgola, senza spazi aggiuntivi.

Se viene indicato un percorso finale, si intende specificare esplicitamente una destinazione nel filesystem dell'elaboratore a cui sono diretti i dati. Generalmente si tratta di una directory, a meno che l'origine sia composta semplicemente da un unico file.

171.1.4.2 except

except <elenco-da-escludere>

Esclude un gruppo di file e directory dalle operazioni che altrimenti avrebbero luogo in base agli altri comandi. In pratica permette di escludere la «installazione» di alcuni file e directory riferiti all'elaboratore di origine.

È ammesso l'uso di caratteri jolly.

171.1.4.3 except_pat

except_pat <elenco-modelli-regexp-da-escludere>

Esclude un gruppo di file e directory dalle operazioni che altrimenti avrebbero luogo in base agli altri comandi, indicandoli attraverso espressioni regolari.

171.1.4.4 special

special [<elenco>] "<comando-sh>"

Permette di eseguire un comando nell'elaboratore remoto, dopo l'aggiornamento di ogni file indicato nell'elenco. In pratica, il comando viene eseguito solo se il file è stato aggiornato. Se non viene indicato alcun file nell'elenco, il comando viene eseguito per ogni file aggiornato.

Il comando viene eseguito nell'elaboratore remoto utilizzando la shell sh, e può anche essere composto da più comandi, separati con il punto e virgola. Questo comando, eredita alcune variabili di ambiente:

FILE -- contiene il percorso completo, nell'origine, del file che è stato aggiornato;
REMFILE -- contiene il percorso completo, nella destinazione, del file che è stato aggiornato;
BASEFILE -- contiene il nome, senza percorso, del file che è stato aggiornato; si riferisce al nome nell'origine.

171.1.4.5 cmdspecial

cmdspecial <elenco> "<comando-sh>"

Permette di eseguire un comando nell'elaboratore remoto, dopo l'aggiornamento di tutti i file. L'elenco fornito come primo argomento viene trasmesso attraverso la variabile di ambiente FILES, nella quale, i vari elementi appaiono separati da due punti (:).

171.1.4.6 notify

notify <elenco-email>

Invia un messaggio contenente le operazioni compiute attraverso la posta elettronica. L'indirizzo può essere espresso con un nome, senza l'indicazione del nodo, e in tal caso si riferisce a quello di destinazione.

171.1.4.7 Esempi

Di seguito vengono mostrati e descritti alcuni esempi riferiti alla configurazione di Rdist attraverso il file distfile oppure Distfile.

GRUPPO_HOST = ( roggen.brot.dg root@linux.brot.dg )

Dichiara la variabile GRUPPO_HOST a cui viene attribuito l'elenco di nodi composto da roggen.brot.dg e da linux.brot.dg specificando anche il nominativo-utente root, da utilizzare per accedere presso quest'ultimo.

GRUPPO_ORIGINE = ( /usr /opt )

Dichiara la variabile GRUPPO_ORIGINE a cui viene attribuito l'elenco di file e directory da duplicare nella destinazione remota. Vengono specificate le directory /usr/ e /opt/.

GRUPPO_ESCLUSO = ( /usr/src/linux* /opt/marameo )

Dichiara la variabile GRUPPO_ESCLUSO a cui viene attribuito l'elenco di file e directory da escludere dalla duplicare nella destinazione remota. Vengono specificati tutti i file e le directory che corrispondono al modello /usr/src/linux* e la directory (o il file) /opt/marameo.

${GRUPPO_ORIGINE} -> ${GRUPPO_HOST} install -oremove,ignlnks ; except ${GRUPPO_ESCLUSO} ; except /usr/share/games ; special /opt/pippo/etc/configura "/opt/pippo/bin/rigenera" ;

Dichiara l'allineamento tra un gruppo di file e directory dell'elaboratore di origine, espresso dalla variabile GRUPPO_ORIGINE, con un gruppo di nodi di destinazione, espresso dalla variabile GRUPPO_HOST, utilizzando gli stessi percorsi nelle varie destinazioni, attivando le modalità remove e ignlnks. In particolare vengono esclusi dall'allineamento i file e le directory rappresentate dalla variabile GRUPPO_ESCLUSO e anche quanto contenuto nella directory /usr/share/games/ (si presume che sia una directory, ma questo non è indicato esplicitamente). Infine, quando viene aggiornato il file /opt/pippo/etc/configura, viene avviato il programma /opt/pippo/bin/rigenera nella destinazione (probabilmente serve a ricostruire altri file in funzione del contenuto del file modificato).

kernel: /usr/src/linux* -> root@linux.brot.dg install /usr/local/src ; notify ( tizio daniele@dinkel.brot.dg ) ;

Dichiara l'allineamento tra i file e le directory che corrispondono al modello /usr/src/linux* con il nodo linux.brot.dg (utente root), nella directory /usr/local/src/. Al termine dell'allineamento, viene inviato un messaggio a tizio@linux.brot.dg e a daniele@dinkel.brot.dg.

171.1.5 # rdist

rdist [<opzioni>] [<etichetta>...]

rdist [<opzioni>] -c <origine>... [<utente-remoto>@]<host-destinazione>[:<directory-destinazione>]

L'eseguibile rdist è quello attraverso il quale si ottiene l'allineamento tra un elaboratore di origine e uno o più elaboratori di destinazione. rdist si avvale normalmente di un file di configurazione, indicato espressamente attraverso l'opzione -f, oppure rappresentato dal file ./distfile, o da ./Distfile. Se si vuole selezionare una o più etichette all'interno di questo file, si possono indicare i nomi di queste alla fine della riga di comando.

In alternativa all'uso del file di configurazione, si può indicare l'operazione di allineamento nella riga di comando, con l'opzione -c. In tal caso, sarebbe come se fosse stato usato il file di configurazione seguente:

( <origine>... ) -> [<utente-remoto>@]<host-destinazione> install [<directory-destinazione>] ;

rdist si avvale di rsh per avviare nell'elaboratore remoto il suo «collega», rdistd, nel modo seguente:

rsh -l <utente-remoto> rdistd -S

Alcune opzioni

-f <file-di-configurazione>

Permette di definire il file di configurazione da utilizzare. Se al posto del nome viene indicato un trattino (-), questo viene atteso dallo standard input.

-D

Abilita l'emissione di messaggi diagnostici estremamente dettagliati.

-m <host>

Questa opzione può apparire più volte nella riga di comando, e serve a specificare uno o più elaboratori da allineare, in modo da limitarne il numero, rispetto a quanto previsto nel file di configurazione.

-n

Simula l'allineamento, limitandosi a visualizzare ciò che farebbe (potrebbe non essere attendibile).

-o<elenco-modalità>

Permette di indicare una o più modalità di funzionamento. Le parole chiave delle modalità devono iniziare subito dopo la lettera «o» dell'opzione, senza spazi, e l'elenco di queste è separato esclusivamente con la virgola, senza inserire altri spazi.

-p <percorso-di-rdistd-remoto>

Permette di indicare il percorso completo di rdistd da avviare nell'elaboratore remoto. Ciò può essere necessario se l'utente utilizzato per accedere attraverso rsh non ha rdistd in uno dei percorsi di avvio dei comandi (la variabile PATH).

-P <percorso-di-rsh-locale>

Permette di indicare il percorso completo necessario ad avviare rsh nell'elaboratore locale. Ciò potrebbe servire anche per avviare un programma alternativo a rsh, purché accetti le stesse opzioni fondamentali, e si comporti nello stesso modo (si può provare con ssh, ma non è detto che funzioni).

Esempi

# rdist -f ~/distfile

Avvia rdist per eseguire le direttive contenute nel file ~/distfile.

# rdist -f ~/distfile prova

Avvia rdist, utilizzando il file di configurazione ~/distfile, specificando di voler eseguire esclusivamente l'etichetta prova.

# rdist -f ~/distfile -p /usr/sbin/rdistd

Avvia rdist per eseguire le direttive contenute nel file ~/distfile, indicando precisamente il percorso completo del programma rdistd negli elaboratori remoti.

# rdist -n -f ~/distfile -p /usr/sbin/rdistd

Come nell'esempio precedente, ma limitandosi a simulare le operazioni.

# rdist -c /usr/lib root@roggen.brot.dg

Aggiorna il nodo roggen.brot.dg in modo che la directory /usr/lib/ contenga le stesse cose di quello locale.

# rdist -c /usr/lib root@roggen.brot.dg:/usr/local/lib

Aggiorna il nodo roggen.brot.dg in modo che la directory remota /usr/local/lib/ contenga le stesse cose della directory locale /usr/lib/.

171.2 Rsync

Rsync è un sistema di copia tra elaboratori (o anche all'interno del filesystem dello stesso sistema locale), in grado di individuare e trasferire il minimo indispensabile di dati, allo scopo di allineare la destinazione con l'origine. L'uso di questo programma è molto semplice, ed è simile a quello di rcp (Remote shell Copy) o anche di scp (Secure shell Copy).

L'aggiornamento dei dati, in funzione delle opzioni utilizzate, può basarsi sul confronto delle date di modifica, delle dimensioni dei file, e anche sul calcolo di un codice di controllo (checksum). In linea di principio, a meno di utilizzare opzioni che specificano qualcosa di diverso, non conta il fatto che i dati siano più recenti o meno, basta che questi siano diversi per ottenerne il trasferimento.

171.2.1 Tipi di utilizzo

Rsync può utilizzare diverse modalità di trasferimento dei file, a seconda delle circostanze e delle preferenze. Per la precisione si distinguono tre possibilità fondamentali.

Copia locale.
In tal caso, la copia, o l'allineamento, avviene all'interno dello stesso sistema, dove l'origine e la destinazione sono riferite semplicemente a posizioni differenti nel filesystem. In questa circostanza, Rsync viene utilizzato come metodo evoluto di copia.
Copia tra elaboratori attraverso rsh o simili.
Si tratta di un'operazione che coinvolge due elaboratori differenti, anche se uno dei due deve essere necessariamente quello locale, e il trasferimento dei dati avviene attraverso rsh o un suo equivalente (come ssh), utilizzando una copia del programma rsync anche nell'elaboratore remoto.
Copia tra elaboratori attraverso un protocollo specifico di Rsync.
Si tratta di un sistema di copia tra elaboratori, dove in quello remoto si trova in funzione una copia del programma rsync, avviata in modo che resti in ascolto della porta TCP 873. In questo caso, la connessione tra elaboratore locale ed elaboratore remoto avviene direttamente senza l'utilizzo di una shell per l'accesso remoto.

171.2.2 Origine, destinazione e percorsi

La forma utilizzata per esprimere l'origine e la destinazione permette di distinguere anche la modalità con cui si vuole che la copia (l'allineamento) sia eseguita.

L'assenza del simbolo di due punti (:), indica che si tratta di un percorso riferito al filesystem locale.
<percorso>
La presenza di un simbolo di due punti singolo (:), indica che si tratta di un percorso riferito a un nodo remoto, e che per la connessione si vuole usare una shell per l'accesso remoto.
[<utente>@]<host>:<percorso>
La presenza di un simbolo di due punti doppio (::), indica che si tratta di un percorso riferito a un nodo remoto, e che per la connessione si vuole usare il protocollo specifico di Rsync.
[<utente>@]<host>::<percorso>

L'indicazione dei percorsi merita attenzione. Per prima cosa si può dire che valgono regole simili a quelle della copia normale; per cui, si può copiare un file singolo, anche indicando espressamente il nome che si vuole nella destinazione (che potrebbe essere diverso da quello di origine), e si possono copiare uno o più file e directory in una destinazione che sia una directory.

Quando l'origine è locale, si possono indicare diversi percorsi, anche con l'aiuto di caratteri jolly che poi vengono interpretati opportunamente ed espansi dalla shell locale. L'esempio seguente, mostra il comando necessario a copiare, o ad allineare i file che terminano per .sgml, della directory corrente, con quanto contenuto nella directory /tmp/prove/ del nodo roggen.brot.dg.
$ rsync *.sgml roggen.brot.dg:/tmp/prove
Quando l'origine è remota, si possono indicare diversi percorsi, anche con l'aiuto di caratteri jolly, che poi vengono interpretati opportunamente ed espansi dalla shell utilizzata nell'utenza remota. La differenza sta nel fatto che i caratteri jolly utilizzati non devono essere interpretati dalla shell locale, e per questo, è bene usare delle tecniche di protezione adatte. Probabilmente, ciò non è indispensabile, perché alcune shell come Bash, ignorano l'espansione dei nomi se questi non possono corrispondere a nulla nel filesystem locale.
L'esempio seguente, mostra il comando necessario a copiare, o ad allineare i file che terminano per .sgml, della directory /tmp/prove/ del nodo roggen.brot.dg, con quanto contenuto nella directory corrente dell'elaboratore locale.
$ rsync 'roggen.brot.dg:/tmp/prove/*.sgml' .
Quando l'origine fa riferimento a una directory, e non si utilizza la barra finale, si intende individuare la directory, come se fosse un file normale. Questa directory di origine viene copiata nella directory di destinazione, aggiungendola a quest'ultima. Per cui, l'esempio seguente serve a copiare la directory locale /tmp/ciao/ nella directory remota /tmp/prova/, generando /tmp/prova/ciao/ e copiando al suo interno i file e le sottodirectory che fossero eventualmente contenuti nel percorso di origine.
$ rsync -r /tmp/ciao roggen.brot.dg:/tmp/prove
Quando l'origine fa riferimento a una directory, e si utilizza la barra finale, si intende individuare tutto il contenuto della directory, escludendo la directory stessa. Per cui, l'esempio seguente serve a copiare il contenuto della directory locale /tmp/ciao/ nella directory remota /tmp/prova/, generando eventuali file e sottodirectory contenuti nella directory di origine.
$ rsync -r /tmp/ciao/ roggen.brot.dg:/tmp/prove

171.2.3 Proprietà dei file

Come si vedrà in seguito, quando si utilizzano le opzioni -o (owner) e -g (group), si intende fare in modo che nella destinazione sia mantenuta la stessa proprietà dei file (dell'utente o del gruppo) che questi hanno nell'origine.

Per ottenere questo risultato, si confrontano generalmente i nomi degli utenti e dei gruppi, assegnando i numeri UID e GID necessari. Quando questa corrispondenza dovesse mancare, viene utilizzato semplicemente lo stesso numero ID. In alternativa, con l'uso dell'opzione --numeric-ids, si può richiedere espressamente l'uguaglianza numerica di UID o GID, indipendentemente dai nomi utilizzati effettivamente.

171.2.4 # rsync

rsync [<opzioni>] <origine> <destinazione>

rsync è l'eseguibile che svolge tutte le funzioni necessarie ad allineare una destinazione, in base al contenuto di un'origine. Per questo si avvale normalmente di rsh, o di un'altra shell per l'accesso remoto.

L'origine e la destinazione possono essere riferite indifferentemente al nodo locale o a un nodo remoto. Quello che conta è che almeno una delle due sia riferita al nodo locale.

Alcune opzioni

-v | --verbose

Permette di ottenere informazioni sullo svolgimento delle operazioni. Questa opzione può essere usata più volte, incrementando il livello di dettaglio di tali notizie.

-I | --ignore-times

Normalmente, si considera che i file che hanno la stessa dimensione e la stessa data di modifica, siano identici. Con questa opzione, si fa in modo che questa presunzione non sia valida.

-c | --checksum

Fa in modo che venga utilizzato un codice di controllo più grande del solito, precisamente di tipo MD4 da 128 bit. Naturalmente, questo implica un tempo di elaborazione più lungo, anche se garantisce una sicurezza maggiore nella determinazione delle differenze esistenti tra l'origine e la destinazione.

-a | --archive

Questa opzione rappresenta in pratica l'equivalente di -rlptDog, allo scopo di duplicare fedelmente tutte le caratteristiche originali, discendendo ricorsivamente le directory di origine.

-r | --recursive

Richiede la copia ricorsiva delle directory, cioè di tutte le sottodirectory.

-R | --relative

Fa in modo di replicare nella destinazione, aggiungendolo a questa, il percorso indicato nell'origine, che comunque deve essere relativo.

-b | --backup

Fa in modo di salvare temporaneamente i file che verrebbero sovrascritti da un aggiornamento. Questi vengono rinominati, aggiungendo un'estensione che generalmente è rappresentata dalla tilde (~). Questa estensione può essere modificata attraverso l'opzione --suffix.

-u | --update

Con questa opzione, si evita l'aggiornamento di file che nella destinazione risultano avere una data di modifica più recente di quella dei file di origine corrispondenti.

-l | --links

Fa in modo che i collegamenti simbolici vengano ricreati fedelmente, come nell'origine.

-L | --copy-links

Fa in modo che i collegamenti simbolici nell'origine, si traducano nella destinazione nei file a cui questi puntano.

-H | --hard-links

Richiede la riproduzione fedele dei collegamenti fisici. Perché questo possa avvenire, occorre che questi collegamenti si riferiscano allo stesso gruppo di file di origine che viene indicato nella riga di comando.

-W | --whole-file

Rsync utilizza normalmente un metodo che gli permette di trasferire solo il necessario per aggiornare ogni file. Con questa opzione, si richiede espressamente che ogni file da aggiornare sia inviato per intero. Questo può essere utile quando si allineano dati contenuti nella stessa macchina, e qualunque elaborazione aggiuntiva servirebbe solo a rallentare l'operazione.

-p | --perms

Riproduce fedelmente i permessi.

-o | --owner

Quando Rsync viene utilizzato con i privilegi dell'utente root, permette di assegnare a ciò che viene copiato lo stesso utente proprietario che risulta nell'origine.

-g | --group

Quando Rsync viene utilizzato con i privilegi dell'utente root, permette di assegnare a ciò che viene copiato lo stesso gruppo proprietario che risulta nell'origine.

-D | --devices

Quando Rsync viene utilizzato con i privilegi dell'utente root, permette di copiare file di dispositivo.

-t | --times

Fa in modo che venga riprodotta fedelmente la data di modifica dei file.

-n | --dry-run

Si limita a simulare l'operazione, senza eseguire alcuna copia. È utile per verificare l'effetto di un comando prima di eseguirlo veramente.

-x | --one-file-system

Permette di non superare il filesystem di partenza, nell'origine.

--delete

Fa sì che vengano cancellati i file nella destinazione che non si trovano nell'origine. Come si può intuire, si tratta di un'opzione molto delicata, in quanto un piccolo errore nell'indicazione dei percorsi si può tradurre nella perdita involontaria di dati.

È questa la situazione più indicata per utilizzare l'opzione -n in modo da verificare in anticipo l'effetto del comando.

Per motivi di sicurezza, la cancellazione dei file che non trovano riscontro nell'origine, ha luogo solo per le directory indicate espressamente nell'origine.

Se Rsync non riesce a leggere i file nell'origine, o non riesce a leggere il contenuto delle directory, si ottiene la cancellazione di quelli contenuti nella destinazione. Anche in questo senso l'opzione --delete va usata con molta prudenza.

--force

Con questa opzione si consente la cancellazione di directory che non sono vuote quando si utilizza anche l'opzione --delete, oppure quando nell'origine quel nome corrisponde a un file normale.

-e | --rsh <comando>

Permette di specificare il comando (il programma) da utilizzare come shell per l'accesso remoto. Normalmente viene usata rsh, ma in alternativa si potrebbe utilizzare ssh, o altro se disponibile.

L'uso di una shell alternativa per l'accesso remoto, può essere configurato utilizzando la variabile di ambiente RSYNC_RSH.

--rsync-path <percorso>

Permette di specificare il percorso completo necessario ad avviare rsync nell'elaboratore remoto. Ciò è utile quando il programma non è nel percorso degli eseguibili nell'utenza remota.

--exclude <modello>

Permette di indicare un nome di file (o directory), o un modello contenente caratteri jolly, riferito a nomi da escludere dalla copia. Il nome o il modello indicato, non deve contenere riferimenti a percorsi, e inoltre è bene che sia protetto in modo che non venga espanso dalla shell usata per avviare il comando.

È il caso di sottolineare che, se viene escluso il nome di una directory si impedisce un eventuale attraversamento ricorsivo del suo contenuto.

--exclude-from <file>

Si comporta come l'opzione --exclude, con la differenza che il suo argomento è il nome di un file locale contenente un elenco di esclusioni.

-C --cvs-exclude

Questa opzione permette di escludere una serie di file, usati tipicamente da CVS, RCS e anche in altre situazioni, che generalmente non conviene trasferire. Si tratta dei nomi e dei modelli seguenti: RCS, SCCS, CVS, CVS.adm, RCSLOG, cvslog.*, tags, TAGS, .make.state, .nse_depinfo, *~, .#*, ,*, *.old, *.bak, *.BAK, *.orig, *.rej, .del-*, *.a, *.o, *.obj, *.so, *.Z, *.elc, *.ln, core.

Inoltre, vengono esclusi anche i file elencati all'interno di ~/.cvsignore, della variabile di ambiente CVSIGNORE, e all'interno di ogni file .cvsignore, ma in quest'ultimo caso, solo in riferimento al contenuto della directory in cui si trovano.

--suffix <suffisso>

Permette di definire il suffisso da usare per le copie di sicurezza dei file che vengono sovrascritti.

-z | --compress

Prima di trasmettere i dati, li comprime. Questo permette di risparmiare risorse di rete durante il trasferimento dei dati.

--numeric-ids

Fa in modo di mantenere gli stessi numeri ID, quando le altre opzioni richiedono la riproduzione della proprietà dell'utente (-o) o del gruppo (-g).

Esempi

# rsync -a /tmp/prove roggen.brot.dg:/tmp/prove

Copia la directory /tmp/prove/ del nodo locale, assieme a tutto il suo contenuto, nel nodo roggen.brot.dg, generando lì, la directory /tmp/prove/prove/, assieme a tutto ciò che discende dall'origine. La copia viene fatta riproducendo il più possibile le caratteristiche originali.

# rsync -a /tmp/prove/ roggen.brot.dg:/tmp/prove

Copia il contenuto della directory /tmp/prove/ del nodo locale nel nodo roggen.brot.dg, nella directory /tmp/prove/. La copia viene fatta riproducendo il più possibile le caratteristiche originali.

$ rsync -R prove/mie/*.txt roggen.brot.dg:/home/tizio

Copia i file che terminano per .txt della directory prove/mie/, discendente da quella attuale, nella directory /home/tizio/prove/mie/ del nodo dinkel.brot.dg.

# rsync -a -z -v /tmp/prove/ roggen.brot.dg:/tmp/prove

# rsync -azv -e ssh /tmp/prove/ roggen.brot.dg:/tmp/prove

Come nell'esempio precedente, ma utilizza ssh come shell per l'accesso remoto.

# rsync -rlptD -zv /tmp/prove/ tizio@roggen.brot.dg:/tmp/prove

Come nell'esempio precedente, ma utilizza la shell predefinita per l'accesso remoto, e accede come utente tizio. Per questo, non tenta di riprodurre la proprietà dei file (utente e gruppo proprietario).

# rsync -rlptD -zv /tmp/prove/ tizio@roggen.brot.dg::prove

Questo esempio è simile a quello precedente, con la differenza che nella destinazione si fa riferimento al modulo prove. I moduli di Rsync vengono descritti nelle sezioni seguenti, in occasione della presentazione delle funzionalità di server di Rsync.

# rsync -rlptD -zv /tmp/prove/varie/ tizio@roggen.brot.dg::prove/varie

Come nell'esempio precedente, con la differenza che si intende allineare solo una sottodirectory, e precisamente /tmp/prove/varie/, con la sottodirectory corrispondente nel modulo prove.

171.2.5 Variabile RSYNC_PASSWORD

L'uso della variabile di ambiente RSYNC_PASSWORD può essere molto utile per automatizzare le operazioni di sincronizzazione dati attraverso Rsync. Quando viene usato come client e il nodo remoto richiede un'autenticazione attraverso una password, questa può essere fornita attraverso la variabile RSYNC_PASSWORD. Se la variabile non c'è, Rsync richiede all'utente di inserirla.

Esempi

#!/bin/sh RSYNC_PASSWORD=1234ciao export RSYNC_PASSWORD rsync -rlptD -zv /tmp/prove/ tizio@roggen.brot.dg::prove

Quello che si vede potrebbe essere uno script personale di un utente che deve aggiornare frequentemente il modulo prove nel nodo roggen.brot.dg (identificandosi come tizio). Quando il server remoto richiede la password, il client locale rsync la legge direttamente dalla variabile RSYNC_PASSWORD.

171.2.6 Server Rsync

Se si vuole utilizzare Rsync per trasferire dati tra elaboratori differenti, senza usare una shell remota, occorre attivare nell'elaboratore remoto un server Rsync. Si tratta in pratica dello stesso programma rsync, ma avviato con l'opzione --daemon.

Il server Rsync può essere avviato in modo indipendente, e in tal caso sta in ascolto da solo sulla porta TCP 873, oppure sotto il controllo di inetd. In questa modalità di funzionamento, è necessario predisporre un file di configurazione: /etc/rsyncd.conf.

Nel caso si voglia avviare il server Rsync in modo autonomo da inetd, basta un comando come il seguente:

# rsync --daemon

Se si vuole inserire Rsync nel controllo di inetd (cosa di sicuro consigliabile), occorre intervenire nel file /etc/services per definire il nome del servizio,

rsync 873/tcp

e nel file /etc/inetd.conf per annunciarlo a inetd:

rsync stream tcp nowait root /usr/bin/rsync rsyncd --daemon

171.2.6.1 Impostazione del servizio Rsync

Rsync utilizzato come server si avvale del file di configurazione /etc/rsyncd.conf per definire una o più directory che si vogliono rendere accessibili attraverso il protocollo di Rsync, come una sorta di servizio FTP. Come nel caso dell'FTP, è possibile offrire l'accesso a chiunque, in modo anonimo, oppure si può distinguere tra utenti definiti all'interno della gestione di Rsync. Questi utenti sono potenzialmente estranei all'amministrazione del sistema operativo in cui Rsync si trova a funzionare, e per questo occorre aggiungere un file di utenti e password specifico.

Rsync definisce moduli le aree che mette a disposizione (in lettura o anche in scrittura a seconda della configurazione). Quando si vuole accedere a un modulo di Rsync si utilizza la notazione seguente:

[<utente-rsync>@]<host>::<modulo>[/<percorso-successivo>]

Quando si accede a un modulo, il server Rsync esegue un chroot() nella directory a cui questo fa riferimento, più o meno come accade con l'FTP anonimo. Per fare un esempio concreto, se il modulo prova fa riferimento alla directory /home/dati/ciao/ nel nodo dinkel.brot.dg, l'indirizzo dinkel.brot.dg::prova/uno/mio fa riferimento al percorso /home/dati/ciao/uno/mio in quell'elaboratore.

171.2.7 /etc/rsyncd.conf

Il file di configurazione di Rsync, /etc/rsyncd.conf, serve solo nel caso lo si voglia utilizzare come server. Se si intende fare affidamento sul servizio di rsh o di ssh, non c'è alcun bisogno di preoccuparsene.

Il contenuto del file di configurazione è organizzato in moduli, ognuno dei quali descrive le impostazioni riferite a una directory del filesystem sottostante.

Ogni riga descrive un tipo di informazione. Le righe vuote, quelle bianche e ciò che è preceduto dal simbolo # viene ignorato. È ammessa la continuazione nella riga successiva utilizzando la barra obliqua inversa (\) alla fine della riga.

I moduli vengono identificati da un nome racchiuso tra parentesi quadre, e la loro indicazione occupa tutta una riga; le informazioni riferite a un modulo sono costituite da tutte le direttive che appaiono nelle righe seguenti, fino all'indicazione di un altro modulo. Le direttive che descrivono i moduli sono delle opzioni che definiscono dei parametri, e sono in pratica degli assegnamenti di valori a questi parametri. Alcuni tipi di parametri possono essere collocati prima di qualunque dichiarazione di modulo, e si tratta in questo caso di opzioni globali che riguardano tutti i moduli (alcuni parametri possono apparire solo all'inizio e non all'interno della dichiarazione dei moduli).

Alcune opzioni globali

Le opzioni globali sono quelle direttive (o parametri) che si collocano prima della dichiarazione dei moduli. Alcuni parametri possono essere collocati solo in questa posizione, mentre gli altri, le opzioni dei moduli, pur essendo stati preparati per la descrizione dei singoli moduli, possono essere usati all'inizio per definire un'impostazione generale. Qui viene mostrato solo l'uso di alcuni parametri delle opzioni globali.

motd file = <file>

Se presente, indica un file all'interno del quale viene prelevato il testo da mostrare agli utenti quando si connettono (il «messaggio del giorno»).

max connections = <n-massimo-connessioni-simultanee>

Come avviene nel protocollo FTP, anche con Rsync può essere importante porre un limite alle connessioni simultanee. Se non viene specificata questa opzione, oppure se si usa il valore 0 (zero), non si intende porre alcuna restrizione.

Alcune opzioni dei moduli

comment = <stringa-di-descrizione-del-modulo>

Questa opzione permette di fornire una descrizione che può essere letta dagli utenti che accedono. Il suo scopo è chiarire il contenuto o il senso di un modulo il cui nome potrebbe non essere sufficiente per questo. Non è necessario racchiudere tra doppi apici il testo della stringa.

path = <percorso-della-directory>

Questo parametro è obbligatorio per ogni modulo. Serve a definire la directory, nel filesystem dell'elaboratore presso cui è in funzione il server Rsync, a cui il modulo fa riferimento. Quando si accede al modulo, Rsync esegue la funzione chroot(), in modo che la directory corrispondente appaia come la radice del modulo stesso.

read only = true|false

read only = yes|no

Questa opzione permette di definire se il modulo debba essere accessibile solo in lettura oppure anche in scrittura. Se non viene specificata, si intende che l'accesso debba essere consentito in sola lettura. Assegnando il valore booleano false (oppure no) si ottiene di consentire anche la scrittura.

uid = <nome-utente>|<id-utente>

gid = <nome-gruppo>|<id-gruppo>

Queste due opzioni permettono di definire l'utente e il gruppo per conto dei quali verranno svolte le operazioni all'interno del modulo. In pratica, Rsync utilizzerà quella identità per leggere o scrivere all'interno del modulo, e questo può essere un mezzo attraverso il quale controllare gli accessi all'interno della directory corrispondente.

auth users = <utente-rsync>[, <utente-rsync>]...

Questa opzione permette di indicare un elenco di nomi di utenti di Rsync a cui è consentito di accedere al modulo. Senza questa opzione, si concede l'accesso a chiunque, mentre in tal modo si impone il riconoscimento in base a un file di utenti definito attraverso il parametro secrets file.

secrets file = <file-di-utenti-e-password>

Questa opzione è obbligatoria se viene usato il parametro auth users. Serve a indicare il file all'interno del quale Rsync può trovare l'elenco degli utenti e delle password (in chiaro).

Esempi

uid = nobody gid = nobody [ftp] path = /home/ftp comment = Esportazione dell'area FTP attraverso Rsync

Questo esempio, preso da rsyncd.conf(5), rappresenta una configurazione minima allo scopo di definire il modulo ftp che consenta l'accesso i sola lettura alla directory /home/ftp per qualunque utente. In pratica, si vuole permettere l'accesso all'area FTP anche attraverso Rsync. Si osservi in particolare l'uso dei parametri uid e gid, all'inizio del file, in modo che Rsync utilizzi i privilegi dell'utente e del gruppo nobody per la lettura dei file.

[ftp] path = /home/ftp comment = Esportazione dell'area FTP attraverso Rsync uid = nobody gid = nobody

Si tratta di una variante dell'esempio precedente, in cui i parametri uid e gid sono stati collocati all'interno del modulo. In questo caso, dal momento che non ci sono altri moduli, l'effetto è lo stesso.

[pippo] comment = Applicativo PIPPO path = /opt/pippo read only = false uid = tizio gid = tizio auth users = caio, semproni secrets file = /etc/rsyncd.secrets

L'esempio mostra la descrizione del modulo pippo all'interno di un file di configurazione che potrebbe contenerne anche altri. In pratica, gli utenti che Rsync identifica come caio e semproni, possono scrivere all'interno della directory /opt/pippo/, generando eventualmente anche delle sottodirectory, utilizzando i privilegi dell'utente e del gruppo tizio (secondo quanto definito dal sistema operativo di quell'elaboratore). Il file delle password necessario a identificare gli utenti caio e semproni è /etc/rsyncd.secrets.

171.2.8 File degli utenti e delle password secondo Rsync

Quando si utilizza Rsync come server e si richiede una forma di autenticazione agli utenti che accedono, è necessario predisporre un file di testo contenente dei record secondo la sintassi seguente:

<nome-utente>:<password-in-chiaro>

Dal momento che il file viene letto da Rsync con i privilegi dell'utente root, è sufficiente che questo file abbia il permesso di lettura per l'amministratore del sistema.

Rsync non stabilisce quale sia la collocazione e il nome di questo file; è il parametro secrets file del file di configurazione a definirlo volta per volta. In generale, nella documentazione originale si fa l'esempio del file /etc/rsyncd.secrets. L'esempio seguente mostra il caso degli utenti caio e semproni, a cui sono state abbinate rispettivamente le password tazza e ciao.

caio:tazza semproni:ciao

È bene ribadire che questo file non ha alcun nesso con il file /etc/passwd (né con /etc/shadow). Gli utenti di Rsync possono non essere stati registrati (nel modo consueto) nell'elaboratore presso cui accedono.

---------------------------

[inizio] [indice generale] [precedente] [successivo] [indice analitico] [contributi]