Heeft big data iets toe te voegen aan het gesprek over literatuur?
Je zult goed moeten zoeken om een schrijver, literatuurwetenschapper, literaire
uitgever of criticus te vinden die deze vraag positief beantwoordt. Als big
data al iets te bieden heeft aan de literaire wereld, dan aan uitgevers van
commerciële fictie die met behulp van gedetailleerde computeranalyses van
successen uit het verleden de ideale thriller in elkaar draaien en zo hopen
nooit meer winkeldochters op de markt te brengen.
Maarten Asscher denkt er niet anders over. Het essay 'Meten en
weten in de literatuur' (uit Toch zit het anders) laat daar geen misverstand over bestaan. 'De minste
manier om over literatuur te spreken is de kwantitatieve manier', luidt de
eerste zin. Vervolgens volgt een prijzenswaardig genuanceerd betoog, waarin hij
ook de voordelen van bijvoorbeeld bestsellerlijsten benoemt (ze zorgen voor een
smaakconvergentie, waardoor het gesprek over boeken wordt vergemakkelijkt),
maar uiteindelijk voegt ook een kwantitatief onderzoek naar woordfrequentie of
etymologische patronen niets toe aan het gesprek over literatuur.
'Het is zeker de moeite waard om te bestuderen', aldus Asscher,
'maar de inhoudelijke waarde van datgene wat wordt bestudeerd, staat er los
van.' En: 'Er zijn vast allerlei gebieden waarop de waarheid [van meten is
weten] staat als een huis. Maar voor literatuur geldt dat het in feite niet om
weten gaat, maar om kennen, om begrijpen, om wegen, om vergelijken en om
waarderen.'
Kun je dat zo absoluut stellen? Nadat ik zelf The
Bestseller Code van Jodie Archer en Matthew L. Jockers (St. Martin's
Press, 2016) heb gelezen, durf ik dat niet meer. De literatuurwetenschappers
doen in dit boek gedetailleerd de uitkomsten uit de doeken van een intensieve
studie naar 5.000 romans – tien procent bestsellers die in de top 10 van New
York Times hadden gestaan, de rest willekeurige titels – om het DNA
van een bestseller te kraken. Ik vond dat bepaald een openbaring.
Om een voorbeeld uit te lichten. Archer en Jockers hadden alle
voorkomende woorden voorzien van een emotionele lading. 'Liefde' is dan
bijvoorbeeld +3, 'mogen' +1, 'afstandelijk' -1, 'pistool' -2 etcetera.
Vervolgens kun je in batches van honderd of duizend woorden de gemiddelde emotionele
lading van die passage berekenen. Als je al die waardes achter elkaar zet,
ontstaat een curve. Of juist niet. Hoe vloeiender de curve, hoe meer de auteur
erin is geslaagd zijn lezer mee te slepen. Hoe meer het lijkt op een
staafdiagram, omdat de emotie heen en weer schiet, hoe meer weerstand een lezer
tijdens het verhaal ervaart.
Wat bleek? Vijftig tinten grijs van E.L. James
vertoonde een vloeiende curve. Haar succes viel dus niet te verklaren uit het
feit dat het onderwerp van sadomasochistische seks mogelijk aansloot bij de
tijdgeest of zoiets diffuus als een makkelijk leesbare stijl, maar eerder uit
het feit dat haar lezer zonder dat ze het in de gaten hadden perfect werden
meegevoerd met het wel en wee van de twee hoofdpersonen. Ze ervoeren geen
merkwaardige breuken, maar een echt, authentiek verhaal.
Het deed me denken aan het beroemde onderzoek van A.L. Sötemann
naar de structuur van Max Havelaar. De gewiekste opbouw van deze
klassieke roman is er volledig op gericht om de lezers die de boodschap van
Multatuli wellicht niet welgevallig is, toch te overtuigen. Wat zou Sötemann
zijn onderzoek hebben kunnen verrijken als hij ook beschikte over data over de
emotionele lading van Multatuli's woorden. Of diens woordfrequentie of de
etymologische patronen in de tekst.
Het gaat in literatuur niet om weten, schrijft Asscher. Maar je
maakt mij niet wijs dat een uitgebreide versie van Sötemanns studie niet kan
bijdragen aan het kennen, begrijpen, wegen, vergelijken en waarderen van Max
Havelaar.
Geschreven bij het afscheid van Maarten Asscher als directeur van Athenaeum Boekhandel – die vanaf morgen wordt opgevolgd door Caroline Reeders. Gepubliceerd op Athenaeum.nl, 24 jan.
Geen opmerkingen:
Een reactie posten