Skip to content
Blog

Microsoft Purview: Advanced Data Classification

Laatste update: 4 oktober 2024

Het classificeren en beveiligen van gevoelige informatie is een essentieel onderdeel van een succesvolle Data Security implementatie. Zo voorkom je ongeautoriseerde toegang tot jouw gevoelige informatie door interne, externe personen of organisaties. Het classificeren wordt in Microsoft Purview gefaciliteerd door sensitivity labels met Microsoft Purview Information Protection. Dat kan handmatig, maar de werkelijke kracht schuilt in het automatisch laten classificeren (Let op: Hier is een E5 of een vergelijkbare licentie voor nodig). Deze manier van classificeren is mogelijk doordat gevoelige informatie wordt herkend. Dit wordt in Microsoft Purview gedefinieerd als Sensitive Information Types. Laat me je meenemen in de wereld van geavanceerde dataclassificatie met Microsoft Purview.

Wat zijn sensitive information types?

De kern van de kracht van het classificeren van gevoelige informatie zijn de zogenaamde Sensitive Information Types. Wat zijn deze SIT nu precies? In eenvoudige bewoordingen zijn SIT patronen die worden gebruikt om gevoelige informatie te identificeren. Denk hierbij aan persoonlijke gegevens zoals burgerservicenummers, bankrekeningnummers en paspoortnummers. Maar ook bedrijfsinformatie, zoals klantgegevens of details over fusies en overnames, worden als gevoelig beschouwd.

Het is belangrijk om binnen jouw organisatie een inventarisatie te maken van de aanwezige gevoelige informatie. Als je een overzicht van deze informatie hebt gemaakt dan ga je deze inzetten binnen Microsoft Purview services of features, zoals bijvoorbeeld:

  • Microsoft Purview Data Loss Prevention policies
  • Sensitivity labels
  • Retention labels
  • Insider risk management
  • Communication compliance
  • Auto-labelling policies
  • Microsoft Priva

Microsoft biedt meer dan 300 ingebouwde SIT om direct in te zetten. Ontbreekt er een SIT? Je bent in staat om een aangepaste SIT te realiseren. Dit is relevant voor bijvoorbeeld project informatie of intellectual property.

Voor deze blog wil ik graag meer vertellen over geavanceerde opties om een aangepaste SIT aan te maken en in te zetten binnen Microsoft Purview. Het betreft de volgende feature:

  • Document Fingerprinting
  • Exact Data Match
  • Trainable Classifiers
  • Microsoft Syntex

Per feature bespreek ik de scope, voordelen, uitdagingen en use case voor het inzetten van de desbetreffende feature.  

Document fingerprinting

Document Fingerprinting maakt het mogelijk om een standard formulier, zoals een HR-formulier, om te zetten in een SIT. Nadat het formulier is omgezet, ben je in staat om deze SIT toe te passen in een Data Loss Prevention policy. Vanuit deze policy herken je gevoelige informatie vanuit de gestandaardiseerde formulieren. Zoals het voorkomen van het delen van HR-formulieren met ongeautoriseerde personen of organisaties.  

Scope 

De scope is volledig gericht op Microsoft Purview Data Loss Prevention. 

Voordelen 

De volgende voordelen, voor het toepassen van Document Fingerprinting, zijn van toepassing: 

  • Het detecteren van gevoelige informatie uit gestandaardiseerde formulieren.  
  • Integratie met SharePoint, Exchange, OneDrive, Teams en Devices. 
  • Gedeeltelijke of exacte matching van gevoelige informatie. 
Uitdagingen 

De voornaamste uitdaging van Document Fingerprinting is gerelateerd aan het niet detecteren van gevoelige informatie gedetecteerd in de volgende situaties: 

  • Wachtwoord beveiligde bestanden. 
  • Bestanden die alleen afbeeldingen bevatten. 
  • Documenten die niet alle tekst bevatten van het originele formulier dat werd gebruikt om de Document Fingerprint te maken. 
  • Bestanden groter dan 4 MB. 
Use case 

De volgende use case is van toepassing voor de inzet van Document Fingerprinting voor het herkennen van gevoelige informatie: 

  • Patenten formulieren. 
  • Overheidsformulieren. 
  • Werknemersinformatieformulieren voor HR-afdelingen. 
  • Aangepaste organisatie formulieren. 
Meer informatie 

Wil je meer weten over Document Fingerprinting? De volgende bron bevat meer informatie: https://learn.microsoft.com/en-us/purview/document-fingerprinting.

Exact Data Match (EDM)

Normaliter maakt een SIT gebruik van generieke patronen voor het herkennen van gevoelige informatie. Er zijn ook situaties waarbij gevoelige informatie aan de hand van exacte, of bijna exacte, waarden herkent dient te worden. Deze informatie is voornamelijk opgeslagen in databases. Dit is waar de inzet van EDM waarde heeft.  

Scope 

De scope van EDM is gericht op de volgende services of features van Microsoft Purview: 

  • Microsoft Purview Data Loss Prevention 
  • Auto-labeling (service and client side) 
  • Microsoft Purview Insider Risk Management policies 
  • Microsoft Purview eDiscovery 
  • Microsoft Purview Insider Risk Management 
  • Microsoft Defender for Cloud Apps 
Voordelen 

De volgende voordelen zijn van toepassing voor het toepassen van EDM: 

  • Minder vals-positieven. 
  • Werken met gestructureerde gevoelige gegevens. 
Uitdagingen 

De volgende uitdagingen zijn van toepassing met het toepassen van EDM: 

  • De configuratie, en testen, is erg arbeidsintensief.  
  • Er zijn twee ervaringen (new & classic) voor het aanmaken van een SIT met EDM.  
Use case 

De volgende use case is van toepassing voor de inzet van EDM voor het herkennen van gevoelige informatie: 

  • Identificeren van gestructureerde & gevoelige informatie uit databases.  
Meer informatie 

Wil je meer weten over EDM? De volgende bron bevat meer informatie: https://learn.microsoft.com/en-us/purview/sit-learn-about-exact-data-match-based-sits

Trainable Classifiers

Trainable Classifiers is een classificatie methode geschikt voor inhoud die niet gemakkelijk wordt geïdentificeerd door de handmatige of geautomatiseerde methoden voor het matchen van patronen. Het is gericht om gevoelige informatie te identificeren op basis van wat het item is, en niet op basis van elementen die in het item voorkomen (patroonmatching).  

Scope 

De scope is gericht op de volgende services of features van Microsoft Purview: 

  • Office auto-labeling en sensitivity labels. 
  • Auto-apply retention label policy met conditions. 
  • Communication compliance. 
  • Data Loss Prevention. 
Voordelen 

De volgende voordelen zijn van toepassing voor de toepassing van trainable classifiers: 

  • Microsoft voorziet 50+ out-of-the-box trainable classifiers voor een versnelde uitrol. 
  • Het aanmaken van custom trainable classifiers wordt ondersteund voor het configureren van scenario’s niet ondersteund vanuit de Microsoft classifiers. 
  • Het wordt ondersteund door middel van Machine Learning.  
  • Verhoogt de nauwkeurigheid van het herkennen van gevoelige informatie. 
Uitdagingen 

De volgende uitdagingen zijn van toepassing met de toepassing van trainable classifiers: 

  • Items met een encryptie wordt niet ondersteund. 
  • De configuratie en het testen is erg arbeidsintensief.  
  • Er is geen inzicht in de configuratie vanuit Microsoft rondom de exacte inhoud van de classifiers.  
Use case 

De volgende use case is van toepassing voor de inzet van Trainable Classifiers voor het herkennen van gevoelige informatie: 

  • Office auto-labeling en sensitivity labels. 
  • Auto-apply retention label policy met conditions. 
  • Communication compliance. 
  • Data Loss Prevention.  
Meer informatie 

Wil je meer weten over Trainable Classifiers? De volgende bron bevat meer informatie: https://learn.microsoft.com/en-us/purview/classifier-learn-about

Microsoft Syntex

Microsoft Syntex maakt gebruik van intelligente documentverwerking, kunstmatige intelligentie (AI) en geavanceerde machine learning om automatisch en doordacht documenten te vinden, organiseren en classificeren in SharePoint, Microsoft Teams, OneDrive en Exchange. Het is  

Scope 

De scope is gericht op de volgende services of features van Microsoft Purview: 

  • Microsoft Purview Information Protection 
  • Microsoft Purview Data Loss Prevention 
  • Microsoft Purview Data Lifecycle Management 

Voordelen 

De volgende voordelen zijn van toepassing voor de inzet van Microsoft Syntex: 

  • Het automatisch toekennen van een sensitivity en retentielabel aan de hand van een gestructureerd of ongestructureerd model.  
  • Een verhoogde nauwkeurigheid dankzij Natural Language Processing en Machine Learning algoritmes.  

Uitdagingen 

De volgende uitdagingen zijn van toepassing voor de inzet van Microsoft Syntex voor het herkennen van gevoelige informatie: 

  • Microsoft Syntex is complex en vereist nauwkeurige planning en expertise voor een succesvolle inzet.  
  • Een data governance beleid is benodigd om ervoor te zorgen dat gegevens correct worden geclassificeerd, getagd en geïndexeerd. 
  • Voor het garanderen van de schaalbaarheid is capaciteitsplanning en infrastructuur management benodigd.   

Use case 

De volgende use case is van toepassing voor de inzet van Microsoft Syntex voor het herkennen van SIT: 

  • Organisaties die reeds Microsoft Syntex inzetten op die wijze de data willen classificeren, beveiligen en de levenscyclus beheren.  

Meer informatie 

Wil je meer weten over Microsoft Syntex? De volgende bron bevat meer informatie: https://learn.microsoft.com/en-us/microsoft-365/syntex/syntex-overview.

Conclusie

Voordat je jezelf verliest in de technische details, is het van cruciaal belang om de vraag te beantwoorden: “Wat zijn onze gevoelige informatie type en hoe herkennen wij deze?”. Zonder dit heldere inzicht wordt het realiseren van een succesvolle Data Security implementatie een moeilijke opgave. Als je hulp nodig hebt bij het beantwoorden van deze vraag of bij de implementatie van Microsoft Purview, staan wij altijd klaar om je te helpen. Samen zorgen we ervoor dat jouw gevoelige informatie in veilige handen blijft.