Datawarehouse: Snel en flexibel inzicht in je bedrijfsprocessen
Een duurzame business intelligence (BI) oplossing ontwikkelen voor een klant in Rotterdam; een groot project waar we ons de afgelopen…
Om een applicatie te testen gebruik je het liefst data die zoveel mogelijk overeenkomt met de realiteit. Maar voor veel software geldt dat er gebruikt wordt gemaakt van persoonsgegevens. Om (nieuwe functies van) een applicatie goed te testen gebruik je deze gegevens liever niet. Hiervoor hebben wij de Enshore Datamasker ontwikkeld. Testen met gemaskeerde data voor de meest reële resultaten, zonder kans op het lekken van gevoelige gegevens.
Het maskeren van een tabel met een miljard records betekent dat de tool 99,9% van alle tabellen qua omvang aan kan. De datamasking-tool is dus op (vrijwel) iedere database toepasbaar. Waar er voor deze toepassing voor is gekozen de data volledig te anonimiseren, hebben we het ook mogelijk gemaakt om data te pseudonimiseren. In beide gevallen is de testdata nog bruikbaar, maar met het gebruik van pseudoniemen is de testdata nog terug te herleiden naar de originele data. Deze functie gebruiken we voor Logspect. Een applicatie waarmee organisaties de privacy van hun klant- en patiëntgegevens beter kunnen waarborgen.
De Enshore Datamasker is ontwikkeld voor een organisatie waar dagelijks gewerkt wordt met grote datasets. De uitdaging was het maskeren van een dataset met een miljard records. Alleen de kolommen met persoonsgegevens hoefde gemaskeerd te worden. Omdat de gegevens niet herleid hoeven te worden naar de originele gegevens, hebben we gekozen ze volledig te anonimiseren.
Bij het anonimiseren van persoonsgegevens is het onmogelijk om de gemaskeerde data terug te zetten naar de originele data. Dit is noodzakelijk in situaties waar testers en ontwikkelaars geen toestemming hebben om persoonsgegevens in te zien. De nieuwe AVG geeft aan dat organisaties in deze situaties alleen compliant zijn wanneer zij geanonimiseerde testomgevingen gebruiken.
Soms is het wenselijk om gegevens te kunnen herleiden nadat ze gemaskeerd zijn. Dit pseudonimiseren gebeurt dan door persoonsgegevens te vervangen door zogenaamde synoniemen. Deze synoniemen kunnen dan weer worden omgezet naar werkelijke persoonsgegevens.