Robotjournalist kan meer dan je denkt

Robots Emerce 700px

Over robotjournalistiek bestaat veel scepsis, maar inmiddels begint automated journalism wel echt een serieuze toepassing te worden. Forbes, Associated Press en News Corp laten algoritmen al langer artikelen schrijven. In Nederland participeren mediabedrijven in wetenschappelijk onderzoek. Computers worden intussen almaar slimmer. Deze maand schreef ik een achtergrondverhaal voor Emerce met als basisvraag: nemen robots de journalistiek over?

De voorbeelden van robotjournalistiek zijn legio. Aardbevingen halen direct na uitbreken de website van LA Times omdat de meldingen door computers automatisch worden omgezet in nieuwsberichten. Persbureau Associated Press werkt sinds vorig jaar met de software van Automated Insights, die het mogelijk maakt om niet 300 financiële berichten per kwartaal te leveren, maar 4.400. Het softwarebedrijf zelf claimt dat het eigen algoritme jaarlijks meer dan één miljard artikelen kan produceren.

Machtsstrijd

In de machtsstrijd om het snelle nieuws doet AP-concurrent Forbes zaken met Narrative Science, dat met de tool Quill een serieuze tegenstrever is van Automated Insights. Hoe anders was dat in 2009, toen een student het programma Stats Monkey ontwikkelde om het verslaan van highschool-wedstrijden te automatiseren. Zes jaar later staat er een miljoenen-business.

Het belangrijkste Nederlandse onderzoek naar automated journalism wordt momenteel uitgevoerd door het interdisciplinaire Fontys Lectoraat Media (Journalistiek, Economie, ICT, Communicatie en Kunsten), dat afgelopen voorjaar een subsidie van 700.000 euro binnenhaalde van het onderzoeksorgaan SIA voor de ontwikkeling van een geautomatiseerde nieuwsredactie. Samen met de Universiteit van Tilburg ontwikkelt het lectoraat onder meer tools die het mogelijk maken om automatisch nieuwsverhalen te vertellen. Het onderzoek krijgt ook steun van brancheorganisatie NDP Nieuwsmedia, waar onder meer De Persgroep, RTL en ANP bij zijn aangesloten. Een gedeelte van het onderzoek vindt plaats bij Telegraaf Media Groep.

GoalGetter

De techniek achter automated journalism schuilt vooral in het aanleren van taal aan computers. Specialist op het gebied van taalgeneratie is Mariët Theune, universitair docent Human Media Interaction (HMI) aan de Universiteit Twente. Hoewel ze dit onderwerp heel breed aanvliegt (van volksverhalen tot 3D-gaming), ontwikkelde ze tien jaar geleden met enkele collega-wetenschappers al een basale applicatie (GoalGetter) die voetbaluitslagen op Teletekst omzet in een redactioneel wedstrijdverslag.

Dat oude onderzoek krijgt nu min of meer een vervolg omdat ze een NWO-subsidie heeft gekregen om samen met de Universiteit van Tilburg aan de slag te gaan met sportverslagen, ditmaal gericht op emotionele taalgeneratie. Dat laatste is technisch al mogelijk, zo blijkt als je deze online test doet van The New York Times. Feitelijke teksten hoeven niet per se van robots te zijn, terwijl automated content zelf inmiddels al heel stijlvol kan worden opgeschreven. De computer is tegenwoordig in staat om sentiment toe te voegen. Bovendien leren computers razendsnel van de fouten die ze maken.

De ontwikkelingen zullen breder zijn dan alleen tekstueel. Algoritmes kunnen ook worden ingezet om informatie te verzamelen of analyseren. Ook valt te denken aan zoeken in video-databases. Daar wordt steeds meer mogelijk door taal- en spraaktechnologie. Door in de toekomst al die aspecten aan elkaar te koppelen, ontstaat er misschien wel echt een allround robotjournalist.

Het complete artikel lezen? Dat kan op Emerce.nl.

Tags: , , , , , , , , , , ,

2 Responses to “Robotjournalist kan meer dan je denkt”

  1. Neys Says:

    Ik wist niet dat al die kranten die artikelen automatisch lieten doen. Nu begrijp ik de term copy paste journalistiek. Het gebeurt dus letterlijk dat computers alles van elkaar overnemen!

  2. Jeroen Mirck Says:

    In Nederland is automated journalism nog niet wijdverspreid, al was het maar omdat het een relatief grote investering is voor dit kleine taalgebied. Die prijzen gaan echter dalen, dus gaan we het hier zeker ook steeds meer merken. Of niet, dat hangt van de geavanaceerde techniek af. Het is natuurlijk een letterlijk voorbeeld van copy/paste, maar die term wordt vooral gebruikt voor journalisten die andermans nieuws overnemen zonder het zelf te verrijken. Dat gebeurt helaas te vaak, maar is ook het gevolg van enorme bezuinigingen in de mediawereld.

Leave a Reply