Deze zomer las ik de stad en zijn onvaste muren, het nieuwe boek van Haruki Murakami. Ik vind zijn boeken een plezier om te lezen. Ze voelen aan als sprookjes voor volwassenen. En ook zijn laatste boek is een heerlijk sprookje om in te verdwijnen.
De zomer is ook een periode waarin ideeën ontstaan. En zo besloot ik deze zomer om twee dingen die me plezier brengen samen te brengen: boeken en datavisualisatie.
Het idee: de hoofdstuklengte visualiseren
Ik kreeg het idee om een visuele weergave te maken van een simpele, behapbare dataset: het aantal pagina’s per hoofdstuk. De stad en zijn onvaste muren is ruim 630 pagina’s dik en bevat 70 hoofdstukken die verdeeld zijn over drie delen.
Het gaat dus om eenvoudige data:
- 3 delen
- 70 hoofdstukken
- Aantal pagina’s per hoofdstuk
Ik vat deze data samen in tabel die bijna net zo eenvoudig is:
En daarmee ga ik aan de slag.
De visualisaties die het niet werden
Een datavisualisatie maak je niet 1-2-3, dat heeft tijd nodig. En in die tijd maak ik verschillende versies. Ik begin met een simpele visualisatie, zoiets als een balkgrafiek. Het doel is niet om iets moois te maken, maar om te checken of de data er goed uitzien.
En dat lijkt het geval.
Vanuit deze functionele test maak ik visuele verkenningen. Omdat het om een persoonlijk project gaat zoek hierbij ik naar een beeld dat me aanspreekt, een beeld dat prettig is om naar te kijken. Ik zet hiervoor vaak de assen uit, zodat enkel het beeld van de grafiek kan spreken.
Ik begin met een gestapelde balkgrafiek die de lengte per deel van het boek laat zien en voeg een witregel toe wanneer een nieuw deel begint:
Leuk, maar ik hier word niet gelukkig van. Dus ik zoek door.
Poging twee is een grafiek die ik zou willen beschrijven als een zonnestraalgrafiek. Hierin is ieder hoofdstuk een zonnestraal. Ik bereken de verhouding tussen het aantal pagina’s van een hoofdstuk en het langste hoofdstuk. Deze verhouding (bijv. 30%) bepaalt intensiteit van de kleur.
Interessanter, maar ook dit is het niet voor mij.
De datavisualisatie die het wel werd
Uiteindelijk kwam ik bij onderstaande visualisatie uit.
Hierin staat ieder vierkant voor een hoofdstuk en gebruik ik dezelfde verhouding als voorheen (pagina’s per hoofdstuk t.o.v. het langste hoofdstuk) om een vierkant te vullen. Hoe voller het vierkant, hoe meer pagina’s het hoofdstuk telt. Verder kies ik ervoor om de informatie van de drie delen niet te gebruiken om zo meer eenheid in het beeld te krijgen.
Het resulteert in een sterk grafisch beeld dat me doet denken aan ramen die opengaan. Alsof de lange hoofdstukken me een beter inkijkje geven in de wereld dan de korte hoofdstukken.
Dit beeld spreekt me aan.
Hier kan ik wat mee.
Mijn drie favoriete Murakami’s vergelijken
Het leuke is dat deze manier van visualiseren me op een nieuwe manier naar een paar van mijn favoriete boeken laat kijken.
Hieronder zie je een visuele weergaven van 1Q84, kafka op het strand en de stad en zijn onvaste muren.
Hierin valt me wat op: het laatste boek wat ik las heeft een ander ritme. Waar zowel 1Q84 en kafka op het strand veel open ramen kennen (relatief lange hoofdstukken), zijn de ramen bij de stad en zijn onvaste muren vaker deels dicht.
Om na te gaan of dit enige betekenis heeft, bereken ik de maximale hoofdstuklengte per boek. Zo ga ik na of de andere twee boeken geen kortere maximale lengte hebben, waardoor een raam snel open staat.
Laten we even kijken:
- 1Q84: max = 25
- Kafka op het strand: max = 19
- De stad en zijn onvaste muren: max = 23
Niet exact gelijk, maar we werken wel met dezelfde orde van grootte wat mij betreft. Er zitten dus echt meer lange hoofdstukken en de twee boeken die ik eerder las.
Voor mijn gevoel vloog ik dan ook door het laatste boek heen. En dit keer niet alleen door het mooie verhaal, maar waarschijnlijk ook door de kortere hoofdstukken!
Nieuwsgierig?
Tijdens het maken van deze visualisatie wordt ik nieuwsgierig: hoe zou dit eruit zien als een print? (En het zou natuurlijk ook zonde zijn om zo’n grafisch beeld als bestand op mijn computer te laten rusten.)
Daarom breng het de wereld in. Ik druk het af.
Zie hier mijn eerste eigen data-gedreven op een boek gebaseerde print:
Best wel cool toch?