L'evoluzione dello storage digitale ha portato alla creazione di sistemi di archiviazione sempre più sofisticati e sicuri. Tra questi, i RAID, nati negli anni ‘80 per migliorare l'affidabilità e le prestazioni dei singoli dischi, giocano tuttora un ruolo fondamentale. Nel corso degli anni si sono evoluti in varie configurazioni con caratteristiche specifiche per rispondere a diversi tipi di utilizzo. Una di queste configurazioni è il RAID 6, che si è largamente diffuso in ambienti server o enterprise, dove i dati richiedono la massima sicurezza e l'accesso anche in caso di guasti.
RAID 6: come funziona
Il RAID 6 è un sistema di archiviazione formato da 4 o più dischi rigidi, combinati come una singola unità logica. Lo scopo di questa concatenazione è offrire una maggiore sicurezza e aumentare le prestazioni dei singoli dischi rigidi. La protezione contro i guasti è ottenuta attraverso la parità, ossia una serie di informazioni che permettono di ricostruire i dati corrotti o mancanti. Mentre le prestazioni sono migliorate utilizzando lo striping, ossia la divisione e distribuzione dei dati in blocchi.
Questa doppia strategia è identica a quella del RAID 5, ma il RAID 6 migliora ulteriormente la sicurezza usando la doppia parità anziché la singola. Sia i blocchi di dati che di parità sono distribuiti equamente secondo il seguente schema:
La doppia parità permette di tollerare fino a due dischi rotti allo stesso tempo. Il suo svantaggio è che comporta un sovraccarico di storage perché occupa sempre due dischi rigidi. Per aumentare l’efficienza nell’uso dello spazio è possibile inserire più di 4 unità e maggiore è il numero di unità, maggiore è la capacità di storage.
Per calcolare la capacità effettiva dell’intero array è possibile usare la seguente formula:
Capacità totale=(Numero di dischi−2)×Capacità disco.
Ad esempio:
Numero di dischi = 6
Capacità singola= 1 TB
Capacità totale dell’array= (6-2) x 1 TB= 4 TB
Di solito si sceglie il numero di dischi in anticipo per risparmiare tempo e complicazioni. Infatti, l’espansione dell' array potrebbe comportare una ricreazione completa, con la copia dei dati su unità temporanee, la creazione del nuovo array e il successivo ripristino dei dati.
RAID 6: striping e doppia parità
Lo striping è un sistema di archiviazione dei dati creato per velocizzare le operazioni di scrittura e lettura. I dati vengono divisi in blocchi (stripes) di dimensione fissa e vengono poi distribuiti sui vari dischi. La dimensione dei blocchi viene stabilita a priori durante la configurazione dell’array.
Un blocco di grande dimensione riduce i tempi di accesso sequenziale, così come la ricostruzione dei file. Un blocco di piccola dimensione ha migliori performance nell'accesso casuale e consente una maggiore precisione nel ripristinare i dati, poiché è possibile identificare facilmente quali parti sono danneggiate o mancanti. Di conseguenza, la dimensione del blocco deve essere scelta con cura durante l'installazione dell'array.
Oltre ai blocchi di dati, il RAID 6 scrive anche le informazioni di parità, usate per verificare l’integrità dei file in caso di loro corruzione o errori di scrittura. Se il sistema rileva dei problemi, fa un calcolo tra i blocchi di dati per vedere se danno come risultato le informazioni di parità. Le operazioni logiche utilizzate sono funzioni matematiche di tipo XOR. Nel RAID 6 possono essere più complesse e avvalersi di diversi tipi di codici.
Il codice Reed-Solomon è uno di quelli più utilizzati, ma nella doppia parità comporta un maggior calcolo rispetto alla singola parità e quindi maggior tempo in scrittura. Per questo motivo, la ricerca continua a esplorare codici innovativi per la correzione degli errori. Tra questi ci sono l'Hamming esteso, il Row-Diagonal Parity (RDP), i Liberation Codes e il Johnston's Code (J-Code).
Come configurare un RAID 6
Per configurare un RAID 6 è necessario avere un minimo di 4 dischi. È meglio che siano identici o almeno delle stesse dimensioni, in modo da avere maggiore compatibilità e uniformità nelle prestazioni. Inoltre, è necessario avere un controller, un componente che gestisce la scrittura dei dati e della parità.
Il controller può essere integrato nella scheda madre o fornito come una scheda addizionale. La sua gestione avviene attraverso il software dedicato o fornito con il sistema operativo. Esistono anche i controller software-based che non richiedono l'installazione di hardware aggiuntivo. Sono semplici da configurare ma, usando le risorse del computer, sono leggermente lenti in scrittura.
Una volta avviato il computer con i dischi e il controller connessi, la configurazione dell’array avviene attraverso il BIOS. In questa fase, è possibile configurare altri parametri come la dimensione del blocco di dati e la modalità di scrittura (striping e doppia parità). Stabiliti questi parametri, si può inizializzare l’array. A questo punto, viene formattato lo spazio di archiviazione creando le partizioni necessarie, e viene installato il sistema operativo. In seguito il controller inizia il suo lavoro, cioè distribuisce i blocchi di dati e le informazioni di parità tra i vari supporti. Questo processo richiede un po' di tempo e dipende soprattutto dal numero e dalla capacità dei dischi.
RAID 6: caratteristiche, vantaggi e svantaggi
Il RAID 6 condivide molte delle caratteristiche del RAID 5, anche se rispetto a questo presenta alcuni vantaggi e svantaggi:
Tra i vantaggi principali ci sono:
- alta protezione dei dati: l’array è in grado di funzionare e di ripristinare i dati anche con due dischi guasti.
- buone prestazioni in lettura: la velocità è simile a quella del RAID 5, grazie allo striping.
Tra gli svantaggi ci sono:
- scrittura lenta: è necessario un calcolo aggiuntivo a causa della doppia parità.
- costi aggiuntivi: a parità di spazio effettivo di archiviazione, il costo è più alto.
- ridotto spazio di archiviazione: la capacità effettiva è inferiore a quella del RAID 5 perché due dischi sono sempre occupati dalla parità. Ad esempio, considerando un set da 4 dischi:
- RAID 5 = 3 dischi per i dati + 1 disco per la parità. Capacità efffettiva= 75% della capacità totale.
- RAID 6 = 2 dischi per i dati + 2 dischi per la parità. Capacità effettiva= 50% della capacità totale.
Tuttavia, aumentando il numero di unità, questa percentuale migliora. Il RAID 6 è perciò diffuso in ambienti dove la sicurezza dei dati è prioritaria rispetto ai costi e alla capacità di storage. È solitamente usato in aziende che gestiscono informazioni sensibili e rischiano gravi conseguenze in caso di perdita di dati.
RAID 6 o RAID 5 ?
Il RAID 6 è adatto in scenari che richiedono una protezione elevata e un uso intensivo dei dati, come i server di grandi dimensioni. In particolare, è indicato quando non sono tollerabili interruzioni nell’accesso ai dati. In questi ambienti, è spesso utilizzato in combinazione con altri livelli per aumentare ulteriormente la resilienza e le prestazioni. Ad esempio, come nel RAID 60, dove viene combinato con un RAID 0.
Il RAID 60 è formato da un array RAID 0 che, anziché distribuire i blocchi di dati direttamente tra i dischi, li distribuisce su set di dischi configurati come RAID 6. Questi ultimi, a loro volta, distribuiscono i blocchi di dati e la parità all’interno dell’array. Una tale configurazione necessita di almeno 8 dischi ed estende la tolleranza a 4 guasti contemporanei (purché non nello stesso array). Inoltre, beneficia dell'aumento delle prestazioni dovuto al secondo livello di striping fornito dal RAID 0. Il RAID 60 è ulteriormente espandibile per aumentare la capacità di archiviazione totale, sia aumentando il numero di array che di dischi.
Anche il RAID 5 è configurabile in maniera simile se combinato con un RAID 0 all’interno del RAID 50. Perciò, in scenari di grandi dimensioni, la scelta tra RAID 5 o RAID 6 dipende soprattutto dal grado di protezione desiderato.
Gli ambienti di dimensioni inferiori, come uffici o piccole aziende, hanno esigenze di archiviazione modeste e budget limitati. Generalmente il RAID 5 è un’opzione più che sufficiente in termini di velocità, sicurezza e costi. Il RAID 6 potrebbe essere utile in situazioni dove la perdita di dati o l’interruzione di un servizio ha conseguenze economiche gravi.
Per gli utenti domestici, il RAID 6 non è particolarmente indicato a causa dei costi e della complessità. Altri livelli che offrono ridondanza dei dati, come il RAID 1 o il RAID 5, sono preferibili.
Il RAID 6 è sicuro?
Il RAID 6 è considerato uno dei sistemi di archiviazione migliori per la protezione dei dati. In ogni caso è possibile che l’accesso si interrompa a causa di più di due guasti fisici, problemi software o errori di configurazione. Ricordiamo che non è un backup e non esegue una copia speculare dei dati come altri tipi di RAID. Perciò una sua implementazione dovrebbe prevedere anche un backup esterno eseguito regolarmente.
Guasti fisici
ll RAID 6 è vulnerabile ai guasti fisici come qualsiasi sistema di archiviazione che si affida a componenti hardware. Ad esempio, i dischi possono subire danni alle parti interne o alla pcb.
I componenti interni possono rompersi a causa di difetti di fabbrica o per l’usura dovuta all'età. Anche il surriscaldamento, dovuto ad una ventilazione insufficiente o a guasti elettrici, è in grado di dilatare i componenti metallici provocando danni alle testine e ai piatti.
La pcb invece è vulnerabile agli sbalzi di corrente: le tensioni elevate provocano la bruciatura di diodi e chip, bloccando il funzionamento del motore interno.
Guasti logici
Mentre il danno fisico può interessare uno o due dischi, a meno che non sia dovuto a difetti di fabbrica presenti in tutto il lotto, il danno logico può interessare l’intero array. Tra i guasti logici, spesso si riscontrano la corruzione dei dati, la loro perdita oppure problemi alle partizioni. A volte, tra le cause primarie, c’è il funzionamento anomalo del controller che provoca scritture errate o incomplete.
La corruzione dei dati si verifica anche durante interruzioni improvvise di corrente mentre il sistema sta scrivendo. In particolare c'è il rischio di write hole, un fenomeno comune a configurazioni che utilizzano la parità, come il RAID 5 e il RAID 6. Se l'alimentazione salta e il sistema operativo interrompe una scrittura in corso, lascia l'array in uno stato in cui alcuni dati vengono aggiornati mentre altri no.
Ciò potrebbe risultare anche in una incoerenza tra dati e parità, che diventa un problema se non viene risolta in tempo. Se l’array fallisce e al suo interno ci sono queste discrepanze, la ricostruzione diventa problematica. Di solito queste incoerenze sono evitabili avviando periodicamente dei test di diagnosi degli errori.
Mentre il RAID 5 è particolarmente vulnerabile al write hole, il RAID 6 è maggiormente protetto grazie alla doppia parità. I due blocchi di parità sono in grado di ricostruire i dati correttamente anche se uno di essi viene scritto in modo incompleto. Nonostante il maggior grado di protezione, è comunque meglio evitare il rischio utilizzando un'infrastruttura con una batteria di backup o una fonte di alimentazione continua.
Errori umani
Un’altra causa di perdita dei dati è l’errore umano. Configurare o espandere l’array senza le conoscenze necessarie espone al rischio di completa inaccessibilità ai dati. A volte è proprio l’errore umano la causa di diffusione dei virus, un’altra minaccia di danno logico che interessa in generale tutti i RAID. Se un utente apre un file infetto da malware, c'è il rischio di perdere tutti i dati memorizzati nell’intero set. Alcuni malware eseguono la crittografia dei file, cioè li rendono inaccessibili finché non viene inserita una chiave di decriptazione. Altri invece provocano la corruzione o eliminazione dei file in tutto l'array.
Recupero dati RAID 6
Il recupero dati RAID 6 si svolge in varie fasi che dipendono dal numero di dischi coinvolti, dal tipo di guasto e dalle possibili complicazioni. Generalmente, se il problema riguarda fino a due dischi, è possibile sostituire i supporti danneggiati con due nuovi e avviare la ricostruzione. In questo caso, le fasi previste sono:
- valutazione del problema: si analizza il problema determinando il numero di dischi coinvolti, lo stato dell'array e la modalità di recupero.
- clonazione dei dischi: viene creata un'immagine dell’array per lavorare sulle copie anziché sugli originali, evitando possibili sovrascritture.
- sostituzione dei dischi guasti: se i dischi sono irrecuperabili vengono sostituiti con altri, preferibilmente dello stesso tipo.
- ricostruzione dei dati: dopo un’analisi dei metadati per comprendere la configurazione, inizia il rebuild vero e proprio. Il controller ricostruisce la situazione originale a partire dai blocchi di dati e di parità.
- verifica e consegna dei dati: i tecnici si accertano che i dischi siano funzionanti e contengano i file originali del cliente.
Le fasi appena elencate valgono per uno scenario standard, ma possono variare da caso a caso. Inoltre, esiste il rischio di incorrere in imprevisti, tra cui i più probabili sono:
- guasto multiplo: se un altro disco fallisce durante il recupero e il numero sale a 3 su 4, il processo si complica ed è necessario recuperare i file manualmente.
- corruzione dei dati: capita di trovare alcuni file corrotti a causa di problemi non risolti in passato. In questo caso, l’array non è ricostruibile subito. È necessario recuperare prima i file corrotti.
Dati gli imprevisti che possono sorgere, quando si verificano uno o due guasti in un RAID 6, è consigliabile affidarsi a personale specializzato. I tecnici possiedono l'esperienza con array di pari o maggiore complessità e hanno già affrontato questo tipo di scenari.
RAID 6 con 3 dischi guasti
Un RAID 6 con 3 dischi guasti è uno scenario raro ma possibile. Rotture multiple che interessano più di due dischi si verificano in circostanze limitate come temperature estreme, danni ambientali estesi, tipo allagamenti o incendi, o errori durante la manutenzione. La possibilità di recuperare i dati in quesi casi è limitata. I tecnici di solito operano seguendo queste fasi:
- analisi dei dischi guasti e intatti: viene condotto uno studio di tutte le caratteristiche dei dischi rigidi, come i dati contenuti, il file system, i metadati, il partizionamento e altre informazioni.
- clonazione dei dischi: si crea un’immagine dell’array su altri supporti, in modo da lavorare su una copia anziché sugli originali.
- analisi e ricostruzione del contenuto: sia i dischi inaccessibili che quelli funzionanti possono contenere dati intatti, soprattutto in presenza di stripe grandi. In tal caso, questi dati vengono estratti direttamente. I dati incompleti sono invece ricostruiti attraverso la parità.
- trasferimento dei file: se la ricostruzione del contenuto ha successo, tutti i file vengono trasferiti su nuovi supporti.
- verifica e consegna al cliente: dopo aver ricostruito l’array si eseguono dei test per vedere se tutto funziona correttamente e se i dati ripristinati sono originali e utilizzabili. Infine, i tecnici consegnano il lavoro ai clienti.
Date le circostanze complesse, il successo dipende anche dalla disponibilità di un backup esterno e dalle azioni compiute dall’utente dopo il danno, che in alcuni casi possono compromettere il recupero.
RAID 6: cosa fare in caso di guasto
Anche per il RAID 6, valgono i consigli generali per non compromettere ulteriormente un sistema degradato o fallito. L’utente deve innanzitutto mantenere la calma e non tentare azioni impulsive nel tentativo di ripristinare il set di dischi. In seguito, le azioni da intraprendere sono:
- individuare il problema: verificare lo stato dei dischi permette di identificare quelli inaccessibili e quelli funzionanti. L’interfaccia software del controller dovrebbe indicare quale unità presenta dei problemi, fornendo anche degli specifici messaggi.
- interrompere l’uso: è fondamentale non tentare di ricostruire l'array o di sostituire i dischi prima di aver consultato un professionista.
Se il sistema continua a funzionare, ma con prestazioni ridotte, è possibile che si stia operando in modalità degradata, il che significa che uno o più dischi hanno problemi ma i dati sono ancora accessibili. In teoria è ancora possibile avviare il rebuild o eseguire un backup dei dati, nel caso non sia mai stato fatto. Tuttavia, per evitare rischi è consigliato chiedere prima un parere tecnico.
Se invece il sistema non è accessibile, è meglio spegnerlo del tutto e contattare subito un'azienda di recupero dati.
RAID 6: come prevenire i guasti
Il RAID 6 è considerato uno dei sistemi di archiviazioni più resilienti, ma ciò non significa che gli utenti non debbano prendere delle misure preventive. Tra queste ci sono:
- monitorare i dischi: un controllo regolare permette di rilevare in anticipo eventuali segni di deterioramento o di anomalie. Il monitoraggio è accessibile tramite il software fornito con il controller o con il sistema operativo. In alternativa, è possibile usare un software di diagnostica specifico.
- se necessario, sostituire i dischi: i dischi che mostrano segni di usura o hanno superato la loro vita utile andrebbero sostituiti per evitare rotture improvvise. Utilizzare dischi di alta qualità e dello stesso lotto evita discrepanze nelle prestazioni e nell'affidabilità.
- effettuare backup regolari: copiare i dati in un luogo sicuro e separato offre maggiori garanzie di recupero, soprattutto nel caso di guasti multipli.
- controllare le condizioni ambientali: il calore eccessivo riduce la vita utile dei dischi, perciò è importante mantenere un ambiente con una corretta ventilazione e temperatura.
- aggiornare il firmware: un controller con un firmware aggiornato garantisce maggiore stabilità e sicurezza. Inoltre, minimizza il rischio di problemi di scrittura o di interfaccia con i dischi.
Queste sono alcune linee guida che gli utenti dovrebbero seguire per abbattere il rischio di rottura dei dischi o di perdita dei dati. Sottolineiamo l’importanza di eseguire periodicamente dei backup, che rendono agevole il recupero nel caso di guasti multipli o di scenari imprevisti.
Conclusioni
In questo articolo abbiamo esaminato in dettaglio le caratteristiche generali e distintive del RAID 6. Nonostante questo sistema di archiviazione offra un’eccellente protezione contro i guasti, esistono sempre delle probabilità di perdita dei dati, soprattutto in mancanza di un backup e in presenza di scenari distruttivi come danni ambientali e virus.
Che si tratti di uno o più dischi inaccessibili, la situazione può ulteriormente peggiorare se si agisce d’impulso o senza le necessarie conoscenze. È fondamentale quindi interrompere l’uso e rivolgersi a dei professionisti del recupero dati.
DataLab dispone dell’esperienza e delle attrezzature necessarie per recuperare dati da RAID 6 parzialmente o totalmente inaccessibili. Abbiamo lavorato su vari tipi di configurazioni e operiamo con la massima efficacia e riservatezza. Se il tuo RAID 6 è in modalità degradata o fallita, non esitare a contattarci cliccando qui. Sapremo offrirti una soluzione tempestiva, trasparente nei costi e nelle tempistiche.
Recupero Dati Professionale