We krijgen voortdurend RAID-systemen binnen, waar de gegevens zijn vernietigd door valse Rebuild operaties. Dit noemen we “fatale rebuilds”.
We onderscheiden de volgende drie fatale rebuild varianten:
– Rebuild met een onjuist aantal schijven
– Rebuild met een verkeerde volgorde van gegevensdragers
– Rebuild met een eerdere defecte schijf
Het kan ook een combinatie zijn van deze opties, waardoor bijvoorbeeld een verkeerd nummer plus de verkeerde volgorde zorgt voor een fatale rebuild. Over het algemeen hebben alle fatale Rebuilds gemeen, dat gegevens op de schijven onherroepelijk worden overschreven. We bespreken deze 3 varianten.
Rebuild met een onjuist aantal schijven
Of het nu te veel of te weinig schijven zijn, de stripes worden overschreven op alle resterende schijven. Als u begint met een rebuild met 4 in plaats van de oorspronkelijke 5 schijven, dan worden op de 4 schijven zo’n 25% van de gegevens overschreven door ongeldige pariteitsinformatie. Bij een rebuild met bijvoorbeeld 3 harde schijven is dit een derde van de data per schijf. Afhankelijk van de configuratie, is het mogelijk dat een schijf steeds minder beïnvloed kan worden.
Een professioneel datarecovery bedrijf kan zelfs in deze gevallen, dus als er bijvoorbeeld een rebuild van een RAID5 of RAID6 is gemaakt met onjuist aantal schijven, nog data terug proberen te halen. Data recovery is dus in veel gevallen nog steeds mogelijk.
Rebuild met een verkeerde volgorde van gegevensdragers
Vaak krijgen we RAID-systemen waarin een rebuild is uitgevoerd, maar met een verkeerde volgorde van de informatiedrager.
Vooral bij RAID met spare disks, gebeurt het dat RAID worden verwijderd en opnieuw in om nog steeds in staat zijn om een of andere manier toegang te krijgen tot het verlies van gegevens. Het komt voor dat het nieuwe RAID andere volgorde schijfeenheden die dan de oorspronkelijke samenstelling.
De pariteit informatie – voor zover het gaat om de originele schijf met hetzelfde aantal – zal niet worden vernietigd in een te bouwen of herbouwen is, en hierdoor behoud je de data.
Echter, het resultaat is meestal veel erger: het bestandssysteem wordt niet door het besturingssysteem herkend, maar geïnterpreteerd als een defect. Het bestandssysteem voert een automatisch reparatie uit (bijvoorbeeld chkdsk (Check Disk) of fsck). Het resultaat is dat een oorspronkelijk redding, juist het bestandssysteem vernietigd.
Een datarecovery is in deze gevallen vaak nog mogelijk, maar is zeer prijzig.
Rebuild met een eerdere defecte schijf
Een soortgelijk effect als hierboven beschreven, treedt op wanneer een eerder mislukte schijf, nogmaals met de RAID wordt verbonden. Meestal ontbreekt een schijf in een RAID-array zonder dat dit wordt opgemerkt. Zodra er nóg een andere schijf faalt – bijvoorbeeld in een RAID5 – heeft u niet langer toegang tot de gegevens.
In veel gevallen, zetten systeembeheerders of de fabrikant de twee mislukte schijven terug naar “online”. Nadat het besturingssysteem opnieuw is gestart, detecteert deze onmiddellijk een file systeem, maar ook met de verkeerde gegevens, omdat delen van de informatie is verouderd en ongeldig is.
Een bestandssysteem controle wordt uitgevoerd en vernietigd hierdoor delen van het bestandssysteem.
Wat te doen bij een fatale RAID rebuild?
De natuurlijke reactie bij een fatale RAID rebuild is om het zelf op te willen lossen. Niet experimenteren, en denken: “Baadt het niet, dan schaadt het niet”. Het wordt alleen maar erger, zodat er helemaal niks meer aan te herstellen valt. Voordat je beseft dat het de verkeerde kant op gaat, of dat je meer stuk maakt dan oorspronkelijk, is het vaak al te laat. Dan ben je nog meer in de problemen en kunnen de originele schijven niet meer worden gebruikt voor dataherstel.