Big data: start today and think big!

Ik denk dat ik geen rare dingen vertel als ik zeg dat de hoeveelheid data die we met elkaar produceren explodeert. En het lijkt erop dat die trend nog wel even doorzet. Ongeveer negentig procent van alle digitale gegevens die momenteel wereldwijd in omloop zijn, is de afgelopen twee jaar gegenereerd. Dat betekent heel concreet dat er werk aan de winkel is op het gebied van big data. Natuurlijk voor bedrijven als Dell EMC, die data zal immers ergens moeten landen, maar uiteindelijk is dit een ontwikkeling die elke organisatie aangaat.

Unanieme definitie
Zo’n tien jaar geleden begonnen steeds meer media en analisten te praten over iets dat ze ‘big data’ noemden. Een term die tot op de dag van vandaag nooit echt goed gedefinieerd is. Het lijkt op het eerste oog in elk geval iets te maken met data en omvang. Het is niet mijn doel om hier voor eens en altijd een unanieme definitie te formuleren voor big data. Wat ik wel beoog met dit verhaal is duidelijk te maken dat deze zogenaamde big data inmiddels al veel invloed heeft op ons dagelijks leven en de manier waarop we werken. Die invloed groeit met de dag. Sterker nog: ik durf te stellen dat organisaties die niet op een of andere manier met deze data aan de slag gaan, nooit succesvol zullen zijn in hun digitale transformatie.

Data-analyse
Er zijn inmiddels legio voorbeelden van successen op basis van big data analytics. Zo gebruikt de Europese Centrale Bank, maar ook een land als China bijvoorbeeld big data in combinatie met artificial intelligence om de financiële risico’s voor de economie van de regio/het land in kaart te brengen. Een ander voorbeeld komt van een grote Nederlandse bank die al enige tijd gebruikmaakt van een datalake. Dit is een grote poel met allerlei soorten gestructureerde en ongestructureerde data, van tekst tot en met audio. Dankzij deze data en de mogelijkheid om daar razendsnel analyses op los te kunnen laten, kan de bank nu in near real time (in plaats van enkele weken!) audit-rapporten produceren. Dankzij deze nieuwe manier van data-analyse kan de bank ook beter risico’s in kaart brengen, waaronder het risico op fraude.

Gezondheidszorg
Ook on de gezondheidzorg is het gebruik van big data bezig met een opmars. Zo zorgen big data-toepassingen bijvoorbeeld voor meer mogelijkheden om in de praktijk te leren over de werking van een geneesmiddel of een behandeling. Dat laat het Nederlandse bedrijf Pacmed zien, door anonieme routinezorggegevens te combineren met ‘traditionele’ onderzoeken. Door machine learning te combineren met medische expertise ontdekken zij nieuwe patronenen die artsen helpen tot betere behandeladviezen te komen voor de patiënten.

Datalake-as-a-Service
Een fabrikant van oerdegelijke Duitse auto’s pakt het net weer iets anders aan. De autobouwer is zich bewust van de waarde die data-analyse het bedrijf kan bieden bij het ontwikkelen van bestaande nieuwe producten en bij het verfijnen van zijn predictive maintenance-modellen. Het bedrijf maakt daarbij gebruik van een zogenaamde Datalake-as-a-Service van een systems integrator. Want ook de opslag, het beheer en de verwerking van data is steeds vaker een make or buy-beslissing. Er is gekozen om de benodigde capaciteit flexibel en schaalbaar in te kopen en gebruik te maken van de expertise van de integrator. Een trend die we vaker gaan zien de komende jaren. Niet in de minste plaats omdat veel organisaties gewoonweg niet genoeg gekwalificeerde mensen kunnen krijgen die dit werk op hoog niveau kunnen uitvoeren.

Data is olie
Dit zijn zomaar drie voorbeelden van organisaties die de data waarover ze kunnen beschikken optimaal inzetten voor hun bedrijfsvoering. Dankzij de omvang van de organisaties spreek je dan al snel over big data. Er zijn echter veel meer en ook kleinere bedrijven die ongestructureerde data succesvol weten in te zetten omdat ze weten dit waardevolle en competitieve informatie oplevert. Soms is de hoeveelheid data ‘big’, soms minder ‘big’. Het gaat erom dat bedrijven een idee hebben wat ze willen bereiken en stappen zetten om daar te komen. Make or buy, dat maakt in wezen niet zoveel uit. Data is de olie van de vierde industriële revolutie. Zorg ervoor dat je eruit haalt wat erin zit. Sla op, analyseer en combineer, want hierbij geldt: 1+1=3. Begin vandaag nog met het maken van plannen om hiermee aan de slag te gaan, want de concurrentie is al begonnen…

Data governance
Voor ik afsluit, nog enkele tips die je in dit kader niet vaak hoort, maar steeds belangrijker worden. Blijf altijd alert op de relevantie van de data waarmee je werkt. Enerzijds is niet alles goud wat er blinkt, maar daar kom je met trial & error en meestal zonder kleerscheuren wel achter. Belangrijker is dat je niet met zogenaamde fake data werkt. Data die bewust corrupt gemaakt is, door welke partij dan ook is verzonnen of veranderd, zoals fake news. Enige vorm van data governance is dan ook aan te raden. En afsluitend: verdiep je in de data waar je mee werkt en het resultaat dat je wilt bereiken. Onwetendheid mag in wezen nooit de grondslag zijn voor een gebrek succes. Mensen die de afgelopen weken flink hebben geïnvesteerd in bitcoins zijn daar een mooi voorbeeld van. De koers is kunstmatig hoog gehouden door een aantal grote beleggers. Dat gaat een keer fout. En dat hadden deze beleggers kunnen weten.

De mogelijkheden van big data zijn eindeloos. Zeker dankzij partijen die nieuwe diensten rondom de opslag en analyse ontwikkelen en aanbieden. Denk niet dat jouw organisatie niet groot genoeg is voor big data analytics, want big staat wat mij betreft niet voor de hoeveelheid gigabytes, maar aan de ambitie van de organisatie. Start today and think big!

About the Author: Jeannine Peek