maandag 10 juli 2017

Recensie 'The Bestseller Code': Zo groot is de waarde van big data voor fictie dus (Inct)

Iedere uitgever van algemene boeken met scepsis over de mogelijkheden van big data, moet The Bestseller Code lezen. Het kan een ervaring zijn die zijn manier van werken – op termijn – fundamenteel zal doen veranderen.

Bestsellers kun je niet voorspellen. Punt. Er is haast geen uitgever van algemene boeken te vinden die deze uitspraak niet onderschrijft. En als iemand het tegendeel beweert, zullen ze denken dat het weer zo'n manager van buiten het vak met het gouden idee om de omzet en winst te verhogen door alleen nog maar bestsellers uit te geven. Ja ja, het zijn rare jongens, die managers van buiten. Dat je tegenwoordig big data kunt inzetten om de bestsellerpotentie van nieuwe titels te meten, wie gelooft dat?
Jodie Archer en Matthew L. Jockers, die in The Bestseller Code het dna van een bestsellende roman hebben bloot gelegd, kennen de scepsis maar al te goed. In een van de eerste artikelen die zij over hun onderzoek schreven, meldden zij dat – in tegenstelling tot het algemeen geloof – seks niet verkoopt. Bestsellers bevatten zelfs nog minder seksscènes de gemiddelde roman. Prompt werd Fifty Shades of Grey van E.L. James dé hit van het decennium. Ging dat niet meer dan 1500 pagina's van a tot z over seks? Hoon was hun deel.

Toch zouden allee wantrouwige uitgevers The Bestseller Code moeten bestuderen. Het duo – zij voormalig redacteur van Penguin en oud-werknemer van Apple; hij hoogleraar Engels aan de universiteit van Nebraska-Lincoln en directeur van het Nebraska Literary Lab – onderzocht 5000 titels uit de afgelopen dertig jaar, waaronder de circa 500 romans die in die periode de New York Times bestsellerlijst hadden gehaald, op uiteindelijk 2800 verschillende kenmerken. Het resultaat na vijf jaar studie is bijzonder overtuigend.
Zo blijkt E.L. James' megaseller in eerste instantie helemaal niet over seks te gaan. Op grond van onderzoek naar de voorkomende zelfstandige naamwoorden gaat het eerste deel van de trilogie voor 21 procent over 'menselijke nabijheid', bevat het 13 procent 'intieme conversatie' en verwijst 10 procent naar 'non-verbale communicatie'. Seks komt op de vierde plaats. Fifty Shades voldoet daarmee nagenoeg perfect aan de ideale verhouding van een bestseller: twee tot drie onderwerpen die gezamenlijk ongeveer 30 procent van de roman uitmaken.
Bovendien bleek E.L. James nog iets perfect te hebben gedaan. Onderzoek naar de emotionele waarde van de gebruikte woorden wijst uit dat de lezer niet ruw heen en weer wordt geschud. Integendeel: al neem je batches van verschillende hoeveelheden woorden, Fifty Shades laat steeds een perfecte curve zien. Met andere woorden: de auteur voert haar lezers bijzonder soepel door de achtbaan van emoties, waardoor zij het gevoel krijgen van een meeslepende leeservaring.

Uiteindelijk komen Archer en Jockers op vier elementen die bestsellers onderscheidt van niet-bestsellers. Naast de ideale verhouding tussen verschillende onderwerpen (inclusief de keuze voor populaire onderwerpen als 'menselijke nabijheid’) en het vermogen soepel van positieve naar negatieve emoties te gaan (of omgekeerd), is dat een stijl die vanaf de eerste zin sterk gericht is op het plot en een karakter met een heldere drijfveer. Dat laatste blijkt bijvoorbeeld uit een voorkeur voor woorden als want of need in plaats van hesitate.
Een uitgever die bij het opbouwen van zijn fondslijst rekening wil houden met deze uitkomsten dient goed te beseffen dat deze elementen kenmerken van een bestseller zijn – en helemaal niets zeggen over welk boek het beste is of het beste zal verkopen. De computer van Archer en Jockers kan alleen de kans berekenen of een manuscript de New York Times bestsellerlijst haalt. En dan blijkt dat geen enkele boek een 100% zekerheid op succes heeft. Zelfs de roman niet die het best alle kenmerken in zich verenigt: The Circle van Dave Eggers.

Wat kan een uitgever met deze uitkomsten? Daarover laten de auteurs zich niet uit. Computers zijn niet geavanceerd genoeg dat ze het zonder de menselijke creativiteit kunnen stellen, is het enige wat ze schrijven. Tot die tijd – als computers al ooit mensen kunnen overtreffen – is het wachten op softwareprogramma’s waarmee uitgevers zelf van ieder nieuw manuscript de bestsellerpotentie kunnen berekenen. Bij te lage score kunnen ze de auteur laten werken aan zijn emotionele curve of drijfveer van zijn hoofdpersoon.
Wanneer die toepassingen komen, is de grote vraag. Vermoedelijk is het ontwikkelen ervan niet zo eenvoudig, gezien de benodigde rekenkracht. Bij een onderzoek hadden Archer en Jockers duizend computers (!) tegelijk nodig. Maar overtuigender nog: beiden hebben hun baan vooralsnog niet opgegeven om een start-up te beginnen. Archer is daarentegen een consultancy gestart om auteurs en bedrijven te adviseren over de nieuwe manieren waarop zij manuscripten kunnen beoordelen. Daar is blijkbaar sneller geld mee te verdienen.
(Eerder gepubliceerd in Inct) 

Geen opmerkingen: