Werk je aan een data analyse, model of algoritme? Dan probeer je iets zinnigs te zeggen over de werkelijkheid. Je hoopt dat je met die informatie een betere keuze kan maken. Maar je kijkt ook naar een beperkte weergave van de werkelijkheid.

Werken met data analyses, modellen en algoritmes lijkt daarom op het gebruik van kaarten.

Waarom gebruiken we kaarten?

Als je van A naar B navigeert, en je nog nooit van A naar B bent gegaan, dan maak je al snel gebruik van een kaart. Kaarten zijn een beperkte, maar zeer nuttige weergave van de werkelijkheid.

Stel dat je een wandeling gaat maken door de natuur. Dan heb je behoefte aan specifieke informatie die je helpt bij het maken van de wandeling, zoals wandelpaden, hoogtemeters en de ondergrond.

Ben je aan het navigeren in de auto, dan ben je niet geïnteresseerd in wandelpaden. Je wilt dan weten waar de weg loopt. Misschien zoek je wat autogerelateerde informatie op, zoals een laadpaal. Of wil je ergens een hapje eten.

Kaarten zijn dus altijd een gefilterde (en daardoor nuttige!) weergave van de werkelijkheid. Een weergave die goed past binnen de context waarin je de kaart nodig hebt.

Analyses, modellen en algoritmes

Data analyses, modellen en algoritmes hebben twee overeenkomsten met kaarten.

Ten eerste baseer je ze op data. We kunnen de werkelijkheid niet 100% vastleggen met data, dus moet je kiezen wat je wel en niet vastlegt. De keuzes die je maakt in het wel of niet vastleggen van bepaalde data en het wel of niet meenemen van data in je model, vormen een filter. Alles wat je niet in het model stopt, kan je niet gebruiken.

Ten tweede is er het resultaat. De manier waarop je de uitkomsten van een datamodel toont of gebruikt, zijn afhankelijk van de context waarin je het nodig hebt. Je toont niet alles wat je model berekent en uitdraait, maar kijkt naar de toepassing. Wil je automatisch een proces aansturen o.b.v. data? Dan stuur je een signaal naar de plek waar het nodig is. Wil je uitkomsten in een dashboard laten zien en er handmatig op sturen? Dan zet je het in een tabel, kies je welke data je wilt gebruiken en hoe je die data visualiseert.

Data analyses, modellen, en algoritmes zijn dus als kaarten omdat je:

  1. de volledige werkelijkheid niet kan vangen in data; en
  2. je de resultaten op zo’n manier gebruikt dat ze nuttig zijn in een bepaalde context.

Maar naast deze twee overeenkomsten is er ook een belangrijk verschil.

Wat als je datamodel onjuist is?

Een wijs man zei ooit:

Alle modellen zijn fout, maar sommige zijn nuttig.

George Box

Wat betekent dit voor het navigeren met een kaart?

Je gaat een stukje wandelen door de bergen en (als je oplet) zie je dat er iets niet klopt. De kaart stuurt je naar een afgrond. Volgens die kaart loopt er een pad, maar dat pad is er in het echt niet. Je ontvangt dan een héél duidelijk signaal uit de werkelijkheid. En je snapt meteen dat de kaart niet juist is.

data analyse modellen algoritmes zijn als kaarten

Dit is een stuk lastiger als je met data werkt en de context minder duidelijke terugkoppeling geeft.

Als je een proces aanstuurt o.b.v. een data-gedreven signaal, wat is, in jouw context, dan het equivalent van de afgrond die nadert?