AI, een zegen of een vloek voor scenaristen?

In februari van dit jaar stond de Amerikaanse filmproducent Tyler Perry op het punt 800 miljoen dollar te investeren in het uitbreiden van zijn productiestudio maar zag hier plotsklaps vanaf. Waarom? Hij had zojuist kennis genomen van het nieuwste AI-model van OpenAI en was verontrust, om niet te zeggen in shock, over de mogelijke gevolgen hiervan voor de werkgelegenheid in de filmbusiness.

Over dat model later meer. Rond diezelfde tijd bezoek ik in Amsterdam een seminar over de vraag hoe AI de schrijverswereld zal gaan beïnvloeden. De mogelijkheid dat kunstmatige intelligentie vroeg of laat het werk van de scenarioschrijver zal overnemen, vind ik verontrustend en een tijdlang heb ik een beetje weggekeken van dit onderwerp, maar uiteindelijk won nieuwsgierigheid het van de zorgen – of de ramptoerist won het van de struisvogel, zo je wilt.

In de Rode Hoed luistert het publiek, typische alfa’s, naar een spreker, echte bèta, die niet zozeer bang is voor kunstmatige intelligentie maar het fascinerend vindt; hij ziet de opeenvolging van ontwikkelingen als een groot avontuur, alsof hij ons een slaapkamerkast toont met een geheime deur naar een wonderbaarlijk land.

Je geeft wel opdrachten, zoals je stagiairs opdrachten geeft, maar grote creatieve beslissingen neem je zelf

Het gaat vooral over ChatGPT, ook ontwikkeld door OpenAI, en gespecialiseerd in het voeren van dialogen met een gebruiker. Ook ChatGPT wordt gezien als een tool die vele banen overbodig gaat maken, maar volgens de spreker moeten wij schrijvers het eerder zien als een stagiair die ons kan helpen om tot betere verhalen te komen – je geeft wel opdrachten, zoals je stagiairs opdrachten geeft, maar de grote creatieve beslissingen neem je zelf.

ChatGPT is niet helemaal nieuw natuurlijk, is vorig jaar al in PLOT Magazine besproken, maar er kan veel in een jaar veranderen, zeker in de wonderbaarlijke wereld van AI. Dus abonneer ik me op ChatGTP4, de nieuwste versie, en onderzoek ik spelenderwijs diens potentie. Zo vraag ik om te beginnen om een kort verhaal te schrijven over ‘mijn overbuurvrouw en de postbode’ en kort samengevat komt hij met het volgende:

De postbode brengt dagelijks de post bij de buurvrouw die voor het raam zit. Op een dag zit ze daar niet, de postbode zoekt en vindt haar, ze is gevallen. Hij helpt haar overeind en sindsdien zijn ze bevriend. The end.

Het is kinderniveau natuurlijk, maar als ik vervolgens om een spannendere en daarna een komische versie vraag, en daarna vraag om het perspectief van protagonist naar antagonist te verleggen, dan doet de tool dat in een handomdraai. Het blijft, alweer en steeds, generiek. Maar doorvragen, specifieke opdrachten geven (prompten) leidt tot beter materiaal. Overigens, vraag ik om een ‘pikant’ verhaaltje met die postbode en mijn overbuurvrouw, dan weigert ChatGPT beleefd. En als ik om een mop vraag komt hij hiermee: Waarom lacht de postbode als hij bij de overbuurvrouw aanbelt? Omdat hij weet dat haar hond ‘Post’ heet! Ik heb tot tien keer toe de opdracht gegeven om een nieuwe mop met de postbode en de overbuurvrouw te bedenken maar geestiger, ahum, dan dit wordt het niet. 

Als tiener was ik groot fan van The Breakfast Club. Voor wie de film niet kent, het is een film over vijf scholieren (“a brain, an athlete, a basketcase, a princess and a criminal”) die voor straf een zaterdag samen op school moeten doorbrengen en tijdens die dag nader tot elkaar komen. Aan het eind van de dag filosoferen ze over de eerstvolgende schooldag; zullen ze elkaar bijvoorbeeld groeten als ze elkaar tegenkomen in de gang?

Mijn stagiair komt meteen met een titel: The Monday After. Nu ben ik onder de indruk

Ik op mijn beurt filosofeerde over en verlangde naar een vervolg op The Breakfast Club. Hoe zou het verder gaan, op die maandag, met mijn filmhelden? Het vervolg is er nooit gekomen, dus vraag ik ChatGPT4 handenwringend om een synopsis te schrijven voor deel twee, zich afspelend op de eerstvolgende maandag. Mijn stagiair komt meteen met een titel: The Monday After. Nu ben ik onder de indruk. Een heerlijke titel, want het klinkt leuk, het is feitelijk juist en het knipoogt natuurlijk naar de frase “the morning after”, wat problemen, conflict belooft.

De synopsis komt met suggesties: Andrew, de atleet, staat onder druk van zijn coach en vrienden om zich te distantiëren van de nieuw gevormde groep.

Dit moet uiteraard nog worden uitgewerkt en een derde akte ontbreekt helemaal. Toch ben ik enthousiast en wat mij al voorspeld was, is eigenlijk al gebeurd binnen een dag: ik gebruik de tool voortdurend, voor van alles, en via ChatGPT kun je ook je lol op met DALL-E, een AI-model dat gedetailleerde afbeeldingen kan genereren op basis van tekstbeschrijvingen. Als ik vraag een beeld te genereren van een scenarioschrijver die bang is voor AI komt hij vrijwel meteen met het plaatje bovenaan dit artikel staat. Kortom, het is big fun allemaal.

Of toch niet?

Terug naar die filmproducent die afzag van zijn miljoeneninvestering. De nieuwe ontwikkeling waar hij zo van schrok heet Sora en de man is er dus van overtuigd dat dit de filmwereld totaal zal veranderen – waarmee talloze banen én studio’s zouden verdwijnen. Maar wat is het precies? De mensen achter Sora leggen het zelf uit:

“Sora kan video’s van maximaal een minuut genereren met behoud van de visuele kwaliteit en naleving van de aanwijzingen van de gebruiker. Sora kan complexe scènes genereren met meerdere karakters, specifieke soorten bewegingen en nauwkeurige details van het onderwerp en de achtergrond. Het model begrijpt niet alleen waar de gebruiker om heeft gevraagd in de prompt, maar ook hoe die dingen in de fysieke wereld bestaan. Het model heeft een diep begrip van taal, waardoor het aanwijzingen nauwkeurig kan interpreteren en boeiende karakters kan genereren die levendige emoties uitdrukken.”

Ze zijn ook eerlijk over de zwakke punten van het model. “Het kan moeite hebben met het nauwkeurig simuleren van de bewegingen in een complexe scène, en het kan specifieke gevallen van oorzaak en gevolg niet begrijpen. Iemand kan bijvoorbeeld een hap uit een koekje nemen, maar daarna kan het koekje geen bijtmarkering hebben.

Het model kan ook de ruimtelijke details van een prompt verwarren, bijvoorbeeld door links en rechts door elkaar te halen, en kan moeite hebben met nauwkeurige beschrijvingen van gebeurtenissen die in de loop van de tijd plaatsvinden, zoals het volgen van een specifiek cameratraject.”

Oké dan. Heel erg to the point: waar normaal gesproken meerdere camera’s, drones, acteurs of een willekeurig huisdier nodig zijn om tot een korte film te komen, hoef je bij Sora alleen een beeld te prompten, te omschrijven, waarna het wordt gegenereerd. Een vrouw met een zonnebril die ’s avonds door Tokio loopt – te zien op YouTube, het is bijna levensecht. Honden in de sneeuw. Een helikoptershot van de oceaan, golven die stukslaan op een strand. 

Voorlopig is Sora alleen beschikbaar voor een beperkt aantal onderzoekers en videomakers. In deze fase wordt getest of er binnen de geldende regels materiaal wordt geproduceerd, AI-bedrijven mogen bijvoorbeeld geen extreem geweld, seksueel getinte beelden of beroemdheden genereren. Maar onlangs maakte Mira Murati, de chief technology officer van OpenAI, bekend dat Sora later dit jaar beschikbaar wordt voor het grote publiek en de videotool op termijn ook uitgerust wordt met een audio- en bewerkfunctie.

Voorlopig kunnen we alleen nog naar filmpjes kijken. Fascinerend, maar de beelden vind ik vaak wat dromerig, op een onaangename manier. De mensen en dieren hebben iets zielloos, een dode blik. Niet direct personages met wie je mee wilt of kunt leven – wat toch wel een voorwaarde is bij een speelfilm.

Maar wat er ook mis is, het zijn natuurlijk kinderziektes, wat zeg ik, babykrampjes – Sora ligt nog in de wieg, zo jong is ze. Als je de vrouw in Tokio vergelijkt met het door AI gegenereerde filmpje van Will Smith die spaghetti at, wat vorig jaar groot nieuws was – het is een enorme sprong vooruit. En als er binnen zo korte tijd zoveel progressie is geboekt, waar gaan we dan naartoe?

Terwijl die producent vreest dat er talloze banen op het spel staan, speel ik met de gedachte dat Sora zomaar eens goed uit kunnen pakken voor creatievelingen. Met name ook voor scenarioschrijvers

Over progressie gesproken: van een scenarioschrijver die met lood in de schoenen naar de Rode Hoed ging, ben ik inmiddels dol op DALL-E, voortdurend in gesprek met ChatGPT en terwijl die producent vreest dat er talloze banen op het spel staan, speel ik met de gedachte dat Sora zomaar eens goed uit kunnen pakken voor creatievelingen. Met name ook voor scenarioschrijvers. Als het nu mogelijk is om met een korte tekst (bijvoorbeeld: twee honden lopen kwispelend door de sneeuw) een filmpje van een minuut te prompten, dan is het op den duur vast mogelijk een heel scenario te prompten.

Ook op YouTube te vinden: een auto racet door bergachtig gebied. Het lijkt alsof de opname gemaakt wordt door een drone die achter de auto aanvliegt – maar zowel auto als omgeving als drone bestaan alleen maar als pixels. En het lijkt ook een scène te zijn uit een film. Doorfantaserend wordt het maken van een speelfilm een beetje als het maken van een animatiefilm, iets dat je min of meer gewoon van je bureaustoel kunt doen. Dat je, de wetgeving even buiten beschouwing gelaten, dan een horrorfilm schrijft, prompt, met in de hoofdrollen James Dean en Katrien Duck, in het Amsterdam van 1912 ten tijde van een sneeuwstorm. Of in 2312 op Saturnus, wat maakt het uit, geld speelt geen rol. Ik zeg wetgeving buiten beschouwing gelaten, en dat klinkt laconiek maar als de geschiedenis iets leert is het wel: als we iets kunnen, dan zullen mensen het gaan doen ook. (Hallo darkweb.)

De scenarioschrijver zal, wanneer Sora doorontwikkeld is, een rockster worden

Jeff Bollow, o.a. scenarioschrijver, regisseur, producer, is nog wat enthousiaster: “De scenarioschrijver zal, wanneer Sora doorontwikkeld is, een rockster worden. Hollywood heeft de schrijver altijd ondergewaardeerd maar uiteindelijk komt alle creativiteit uit het brein van de schrijver.” (Zijn woorden, niet de mijne.) “En nu komen er tools waarmee de schrijver het verhaal dat in zijn hoofd zit niet alleen kan opschrijven maar ook kan verbeelden.”

Dat kan iedereen overigens, als het zover is, maar kan iedereen op die manier films maken? Bollow vergelijkt het met Final Draft – iedereen kan ermee leren werken, maar niet elk in Final Draft geschreven script heeft de potentie om een goede film te worden. Met andere woorden, iedereen kan wel een tekst prompten dat leidt tot een filmpje, maar een verhaal is meer dan ‘twee kwispelende honden in de sneeuw’.

Tot zover de toekomst.

Een tijdje terug heb ik een script geschreven, getiteld De Break-Up Club. En ja, de titel is een knipoog naar die highschool-klassieker, maar het gaat kort gezegd over een man die je in kunt huren als je het uit wil maken met je partner maar het ‘slecht nieuwsgesprek’ niet zelf aan durft te gaan. Ik vat voor ChatGPT het verhaal van de film in een alinea samen en vraag, puur uit nieuwsgierigheid, om een poster. Het resultaat is een oubollige tekening, die doet denken aan een kinderboek uit de jaren 50. Ik zeg specifiek dat ik een kibbelende man en vrouw in een auto wil, modern en vooral fotorealistisch. Dat laatste, wordt me uitgelegd, mag hij niet doen. Ik krijg weer twee ‘getekende’ personages en het is allemaal wel aardig, maar als ik binnen het plaatje een paar kleine aanpassingen wil, krijg ik wel die aanpassingen, maar in een heel nieuwe setting.

Het is, kortom, een frustrerende bezigheid en dat DALL-E me uiteindelijk na heel veel geprompt precies zal geven wat ik wil, vergeet het maar. Dat ik ooit het script kan prompten en er dan als bij toverslag een film is, precies zoals ik de film wil hebben, voelt zacht gezegd, en in meerdere opzichten, nog heel erg ver weg… Gelukkig voor mij is het voor dit script ook niet nodig, want de film is al gedraaid. Heus niet perfect, maar met hart en ziel.

Wat zoek je?