backup

Una soluzione di backup affidabile è indispensabile per proteggersi dalle perdite di dati causate da: guasti hardware, errori umani, attacchi informatici o disastri naturali. Non basta chiaramente pianificare un backup periodico dei dati, ma bisogna tenere conto delle diverse strategie di backup, destinazioni e repliche multiple, consistenza: tutti fattori che incidono sulla possibilità effettiva di ripristinare i dati.

Strategie e tecniche di backup

Un primo passo fondamentale per la scelta dell’approccio giusto da seguire è l’analisi e classificazione della tipologia  e disponibilità dei dati. Successivamente si sceglierà tra le differenti strategie e tecniche di backup che meglio si adattano alle esigenze, analizziamone qualcuna:

  1. Backup completo
    Un backup completo comporta la copia di tutti i dati da un’origine a una destinazione. Sebbene fornisca una copertura completa, può richiedere molto tempo e molte risorse, soprattutto per set di dati di grandi dimensioni.
  2. Backup incrementale
    I backup incrementali copiano solo i dati che sono cambiati dall’ultimo backup, riducendo lo spazio di archiviazione e il tempo di backup. Tuttavia, il ripristino dei dati richiede il backup completo e tutti i successivi backup incrementali.
  3. Backup differenziale
    Similmente ai backup incrementali, un backup differenziale acquisisce le modifiche dei dati dall’ultimo backup completo. A differenza dei backup incrementali, il ripristino dei dati richiede solo l’ultimo backup completo e l’ultimo backup differenziale, semplificando il processo di ripristino.
  4. Backup snapshot
    I backup snapshot catturano lo stato di un sistema o di un set di dati in un momento specifico. Forniscono una visione coerente dei dati a scopo di backup, consentendo un rapido ripristino in caso di danneggiamento dei dati o guasti del sistema, sebbene, a rigore non rappresentino una soluzione “pura” di backup.
  5. Protezione continua dei dati (CDP)
    La Continuous Data Protection acquisisce e replica continuamente le modifiche ai dati in tempo reale, garantendo una perdita di dati minima in caso di guasto. Offre funzionalità di ripristino quasi istantaneo, rendendolo ideale per applicazioni mission-critical.
  6. Versioning
    I backup di controllo delle versioni conservano più versioni di file, consentendo agli utenti di ripristinare gli stati precedenti, se necessario. Protegge da modifiche o eliminazioni accidentali dei file, fornendo un ulteriore livello di protezione dei dati.

Destinazioni

Nel pieno rispetto della regola empirica del backup 3-2-1 (3 copie, su almeno 2 destinazioni differenti e almeno 1 offsite) è necessario creare le copie dei dati su più destinazioni. Illustriamo i vari dispositivi di archiviazione e posizioni comunemente utilizzati per i backup

  •  Archiviazione sul cloud: è la destinazione ideale per repliche off-site dei dati. Nell’ampio scenario di offerta da parte di provider di tali servizi, è consigliabile orientarsi verso soluzioni che implementino versioning, crittografia e che siano affidabili e performanti (ad es. S3 e compatibili).
  • Unità storage locali direttamente collegate:  rappresentati da una batteria di dischi direttamente collegati al dispositivo da proteggere nel più classico setup di archiviazione di backup locale.
  • Network-Attached Storage (NAS): dispositivo di rete dotato di storage e ridondanza che consente il salvataggio dei dati in rete locale o sede remota.
  • Backup su nastro e dispositivi ottici: tecnologia più datata rappresentata da unità nastro e supporto ottici, storicamente utilizzata per i backup di archivio.
  • Ibrido: combinazione strategie di backup locale e su cloud, offrendo i vantaggi di entrambi gli approcci. Inizialmente viene eseguito il backup dei dati localmente per un accesso rapido, con trasferimenti periodici nel cloud per la ridondanza off-site e il ripristino di emergenza.

Deduplicazione

Un tecnica utilizzata per ridurre i requisiti di archiviazione eliminando i dati ridondanti è la deduplicazione che funziona identificando i blocchi di dati duplicati nel set di dati di backup e archiviando solo un’istanza di ciascun blocco univoco. Questo processo aiuta a ottimizzare l’utilizzo dello spazio di archiviazione, ridurre al minimo le finestre di backup e semplificare il trasferimento dei dati sulle reti. Sinteticamente, il processo di deduplicazione funziona in questo modo:

  1. Chunking dei dati: il software di backup suddivide i dati in blocchi più piccoli, di dimensione fissa o variabile, spesso definiti blocchi o segmenti.
  2. Hashing: ogni blocco di dati viene elaborato tramite un algoritmo di hashing per generare un identificatore univoco per il contenuto del blocco.
  3. Confronto degli hash dei blocchi di dati in entrata con quelli già archiviati nell’indice di deduplicazione.
  4. Eliminazione duplicati: se un nuovo blocco di dati corrisponde a un blocco esistente nell’indice, viene archiviato solo un riferimento al blocco esistente e i dati ridondanti vengono eliminati.
  5. Archiviazione dati univoci: solo i blocchi di dati univoci che non corrispondono ai blocchi esistenti vengono archiviati come nuove voci nel repository di backup.

Nel complesso, il backup con deduplicazione rappresenta una strategia preziosa per ottimizzare l’efficienza dello storage (minore spazio richiesto), la banda e il trasferimenti dati (soprattutto per backup remoti), semplificando le operazioni di backup e ripristino nei moderni ambienti IT.

Conclusione

La scelta della giusta tecnica di backup dipende da vari fattori quali volume dei dati, obiettivi del tempo di ripristino (RTO), obiettivi del punto di ripristino (RPO), budget e requisiti di sicurezza. È essenziale rivedere e aggiornare regolarmente la strategia di backup per adattarla alle esigenze aziendali in evoluzione e ai progressi tecnologici.
Inoltre,  le strategie di backup andrebbero sempre integrate nella policy più articolata di Continuità Operativa (Business Continuity) garantendo l’integrità, disponibilità e l’accessibilità dei tuoi dati quando ne hai più bisogno. Infine, la deduplicazione rappresenta una tecnica di ottimizzazione che può essere implementata a vari livelli : globale su più processi di backup o localmente all’interno di singoli set di backup. L’efficacia della deduplicazione dipende da fattori quali la ridondanza dei dati, la frequenza del backup e l’algoritmo di deduplicazione utilizzato.

Share to...