Naast goede back-up monitoring tools is het belangrijk ook periodiek de back-ups te herstellen op een test-omgeving. Bij voorkeur doen wij elk half-jaar een Disaster Recovery Test. Een Disaster Recovery Test is het proces waarbij we een gecontroleerde simulatie uitvoeren van een potentiële noodsituatie om te zien of hun herstelplan werkt en om eventuele tekortkomingen te identificeren. Het is nodig om ervoor te zorgen dat de bedrijfsvoering bij een echte ramp of storing snel kan worden hervat en om gegevensverlies of downtime te minimaliseren. Het kan ook helpen om de naleving van regelgeving te garanderen en de reputatie van het bedrijf te beschermen.
Bij een DR test testen wij een vijftal ‘wat als’ scenario’s:
- Brand/waterschade
- Hardware fouten
- Dataverlies
- Hijack server
- Stroomstoring
Helaas verloopt niet elke back-up succesvol. Het kan bijvoorbeeld voorkomen dat de back-up schijf vol zit of dat er een korte onderbreking is geweest van de verbinding. De gebruikte back-upsoftware, Veeam, probeert automatisch meerdere keren bij een fout de back-up opnieuw uit te voeren. Denk bijvoorbeeld aan een switch die vastloopt en uit zichzelf herstart wat de verbinding kort onderbreekt. Daarnaast gebruiken wij monitoring systemen om dit soort fouten voor te zijn en krijgen we notificaties om direct actie te ondernemen indien nodig.
Voor de offsite back-up geldt grotendeels hetzelfde. Het kan daarbij voorkomen dat tijdens een merge actie (het samenvoegen van meerdere back-ups) een internetstoring optreed en deze daardoor onderbroken wordt. Is dit een korte onderbreking dan gaat deze eveneens automatisch meerdere keren proberen de back-up opnieuw uit te voeren. Mocht het een grotere storing zijn dan stopt na verloop van tijd de back-uptaak en gaat deze op een later moment het opnieuw proberen.
Het mislukken van de laatste back-up kan wel betekenen dat in geval van een calamiteit er mogelijk teruggegaan moet worden naar een eerder herstelpunt. Dit heeft als gevolg dat er meer dataverlies optreed. Het is daarom van belang om bij een fout bij een van de back-ups te controleren of er actie benodigd is en de eventuele benodigde acties uit te voeren.