Welke stappen kan je nemen om datagedreven werken tot in de vezels van je organisatie te laten doordringen? En hoe maak je de stap van experimenteren met artificial intelligence (AI) en machine learning (ML) naar het daadwerkelijk benutten van je data? In deze blogpost gaan we in op de uitdagingen van het opschalen van je Proof of Concept (PoC) naar productie.
Steeds meer bedrijven zien de kracht van datagedreven toepassingen binnen organisaties in. De belangrijkste redenen voor het gebruik van data zijn het opdoen van nieuwe inzichten (bijvoorbeeld inzicht in het productsucces binnen verschillende doelgroepen), het verhogen van de omzet (bijvoorbeeld door te focussen op specifieke klantgroepen) en het verlagen van kosten (bijvoorbeeld door kostenoptimalisatie van logistieke processen door deze te baseren op voorspellingen).
Veelal wordt hier artificial intelligence (AI) of machine learning (ML) voor ingezet. Een volgende stap in het gebruiken van data om een voordeel te behalen op de concurrentie is het ontwikkelen van nieuwe businessmodellen. Hierbij kan je denken aan het beschikbaar stellen van (geanonimiseerde) data aan geïnteresseerde derde partijen, wat ook wel data monetization wordt genoemd.
Proof of concept opstarten
Maar waar begin je nou eigenlijk als jouw organisatie een datagedreven transformatie wil maken? Stel, je hebt de juiste mensen bij elkaar gevonden en bent klaar om met de data binnen je bedrijf aan de slag te gaan. Wat is dan je eerste stap?
1. Begrijp de mogelijkheden van AI – en snap ook wat wel en niet kan
AI en ML vormen niet de oplossing voor alle problemen waar je op dit moment in je bedrijf tegenaan loopt. De ontwikkelingen in dit werkveld volgen elkaar weliswaar in rap tempo op, maar dat betekent nog niet dat de mogelijkheden van data en AI oneindig zijn.
Tip van InSpark
Het allerbelangrijkste is dat je niet alleen maar kijkt naar welke problemen je met data kan oplossen, maar welke ook echt de moeite waard zijn om op te lossen. Dit wordt business- and data understanding genoemd.
Figuur 1: Identificeer problemen die de moeite waard zijn om op te lossen
2. Focus op de juiste use-case
Je bent enthousiast en ziet eindeloze mogelijkheden om waarde toe te voegen, maar welke use-case is de juiste om als eerste op te pakken?
Het lijkt wellicht een goed idee om direct een lastig project op te pakken om zo de toegevoegde waarde van datagedreven oplossingen duidelijk te maken. Bedenk echter dat de complexiteit van dergelijke problemen de kans verkleint om op korte termijn resultaten te boeken. Het is dus beter om te starten met een use case waarvoor minder inspanning nodig is, maar waarbij je wel voldoende impact kan maken. Het belang om aan de keuze voor een goede use-case voldoende tijd te besteden, kan niet genoeg benadrukt worden.
Tip van InSpark
- Time-box het experimenteren met use-cases. Als de waarde binnen enkele weken niet kan worden aangetoond, dan zit die er waarschijnlijk ook niet in.
- Spreid je kansen. Het is beter om meerdere korte experimenten te doen dan te starten met één groot experiment. Hiermee vergroot je zowel de slagingskans als het aantal potentiële stakeholders waarvoor je een overtuigend experiment hebt opgetuigd.
Figuur 2: Kies de juiste use-cases bij het opstarten van je experimenten
3. Definieer een succesvolle PoC
Als je weet op welk probleem je je gaat focussen, dan is dit het moment om de PoC vorm te geven. Denk hierbij na over de volgende aspecten van het experiment:
- Wanneer is je project succesvol?
- Hoe zorg je ervoor dat dit bij de juiste stakeholders (vaak binnen de business) landt?
- Wie is er verantwoordelijk voor de budgetten?
- Enzovoort.
Tip van InSpark
Het vaststellen van een succesvolle PoC gaat verder dan alleen de IT-afdeling. Experimenten waarbij de inhoudelijke (business-)experts worden betrokken hebben een veel grotere kans van slagen dan experimenten waarbij zij niet actief deelnemen.
Figuur 3: Drie aandachtsgebieden bij de realisatie van een succesvolle PoC
Als je bovenstaande stappen hebt doorlopen dan is de kans groot dat de PoC succesvol is en dat je organisatie de waarde inziet van de nieuwe datagedreven manier van werken.
Je bent nu klaar voor de volgende fase, namelijk het opschalen naar productie. Tijd om de in theorie aangetoonde waarde ook echt waar te maken.
De uitdagingen bij opschalen naar productie
De belangrijkste uitdagingen waar bedrijven bij het opschalen van PoC naar productie tegenaanlopen, zijn in grote lijnen in drie categorieën in te delen:
- Het realiseren van een uniforme werkwijze;
- De schaalbaarheid en flexibiliteit van de oplossing;
- Het management van de oplossing.
Er is namelijk een reële kans, zeker bij grotere organisaties, dat je niet de enige binnen je organisatie bent die een start heeft gemaakt met het gebruik van bedrijfsdata. Wellicht hebben andere afdelingen ook al successen geboekt met hun proof of concepts waar je IT-afdeling niet eens weet van heeft.
Door het gebruik van clouddiensten wordt deze vorm van shadow IT een stuk realistischer en het komt dan ook geregeld voor dat er verschillende ’data-eilanden’ gecreëerd worden met dezelfde data en alle gevolgen van dien. Met het oog op de toekomst en in het kader van compliance wil je voorkomen dat er verschillende dataplatformen worden opgezet. Met andere woorden: hoe zorg je voor een standaardplatform en een uniforme werkwijze?
Zodra de successen die je behaalt met je nieuwe werkwijze zich binnen de organisatie verspreiden, zullen steeds meer collega’s realtime-toegang willen tot deze nieuwe inzichten. Dit vereist een schaalbare en flexibele infrastructuur, waarmee je voorkomt dat jij of jouw team de bottleneck wordt in dit proces.
Oplossingen op productieniveau hebben impact op de hele bedrijfsvoering en hierbij moet ook het management van de gehele oplossing worden ingeregeld. De belangrijkste zaken om rekening mee te houden zijn:
1. Security
Het is van cruciaal belang dat je data veilig worden opgeslagen en dat alleen de juiste mensen hier toegang toe hebben. Met de bredere adoptie van datagebruik binnen je organisatie wordt security een van de belangrijkste pijlers van je oplossing. Zorg daarnaast niet alleen voor een veilige inrichting, maar richt ook 24×7-monitoring in zodat verdachte gedragingen worden gedetecteerd en opgevolgd. Protect, Detect & Respond noemen wij dit.
2. Governance
Met de komst van de AVG/GDPR is het belang van goed databeheer binnen organisaties alleen maar groter geworden. Onderwerpen waarover je moet nadenken zijn bijvoorbeeld opslag en verwijderen van data en processen en procedures rond datagebruik en dataverwerking. Een goede data governance in combinatie met security monitoring draagt bij aan een compliant organisatie.
3. Monitoring van de datastromen
Zodra data een bedrijfskritische rol innemen in primaire processen van je organisatie, moet de gehele keten van databron tot en met de eindgebruiker (ook wel bekend als pipeline) worden bewaakt. Alleen actieve monitoring zal ervoor zorgen dat er snel actie kan worden ondernomen wanneer een onderdeel niet juist functioneert. Het is dus belangrijk om de afspraken hierover duidelijk vast te leggen in een SLA.
4. Schaalbaarheid van de gehele oplossing
Omdat de vraag naar en het gebruik van data binnen je organisatie kan fluctueren, is het belangrijk een oplossing te kiezen die eenvoudig schaalt, zowel omhoog als omlaag. Dit moet dus gelden voor alle componenten in de gehele keten. Moderne cloudproviders hebben een legio aan datadiensten beschikbaar waar je uit kunt kiezen. Zorg er dus voor dat je een goede solutionarchitectuur opstelt met een ervaren data-architect.
5. Cost management
Moderne dataomgevingen zijn enorm schaalbaar. Hyperscale & serverless zorgen ervoor dat de kosten meeschalen met het gebruik. De kosten kunnen door diverse fouten echter ook exponentieel stijgen. Het vereist een goede oplossing die dit monitort en waarbij wordt ingegrepen om vervelende verrassingen te voorkomen. Daarnaast kan er ook geoptimaliseerd worden zodra je intensief gebruik maakt van de oplossing.
6. Life cycle management
Een moderne cloud-native dataomgeving bestaat vaak uit PaaS- en serverlessdiensten die worden beheerd door een cloudprovider als Microsoft Azure. Dit biedt enorme voordelen, want je hoeft zelf geen complexe infrastructuur meer in te richten en te onderhouden. Deze clouddiensten zijn echter ook aan veranderingen onderhevig. Denk dus ook aan het onderhouden, updaten of uitfaseren van de verschillende onderdelen in de gehele dataketen.
Er zijn dus veel aandachtpunten en ontwerpkeuzes om rekening mee te houden bij het kiezen van een juiste oplossing voor het realiseren van je datastrategie. Bovenstaande uitdagingen kunnen de snelheid en mate van executie ernstig verlagen. Tegelijk zijn het wel cruciale stappen om tot een toekomstbestendige oplossing te komen. Hoe zorg je er nu voor dat je een toekomstbestendig, schaalbaar, veilig en flexibel modern dataplatform in korte tijd operationeel hebt?