RAG-systemen verbeteren AI in de journalistiek, maar uitdagingen blijven
Onderzoek toont aan dat nieuwsorganisaties onder druk staan om betrouwbare, duidelijke antwoorden te geven in een tijdperk van gepersonaliseerde nieuwsstromen en ‘zero-click searches’. Generatieve AI-modellen blijken echter vaak onnauwkeurig en missen context, wat journalistieke normen schaadt. Dit onderzoek testte of Retrieval Augmented Generation (RAG) dit kan verbeteren. Het Vlaams/Nederlandstalige NL-RAG-model presteerde het beste door specifieke afstemming op taal en domein. Hoewel RAG feitelijke fouten vermindert, blijft context soms oppervlakkig. Goede AI in de journalistiek vereist dus nuance, heldere uitleg en aanpassing aan diverse gebruikers.
Studie over
artificiële intelligentie
Onderzoeksmethode(n)
Survey
Medium/technologie
Artificiële intelligentie (AI)
Soort publicatie
Wetenschappelijk artikel
Tags
Artificiële intelligentie
journalistiek
bias
innovatie
transparantie
chatbot
Kerninzichten
Globale resultaten
AI-modellen vertonen de grootste problemen op het gebied van feitelijke nauwkeurigheid en contextuele volledigheid. Deze tekortkomingen komen systematisch voor.
RAG-systemen verminderen ernstige feitelijke fouten aanzienlijk, maar lossen problemen zoals onvolledige of tegenstrijdige context niet volledig op.
Het NL-RAG-systeem presteerde beter dan de andere modellen, wat wijst op het belang van afstemming op taal en domein.
Kwantitatieve analyse
Feitelijke nauwkeurigheid:
RAG-systemen verminderen ernstige fouten, vooral bij het NL-RAG-model.
Studenten merkten minder fouten op dan professionals, wat wijst op verschillende beoordelingsniveaus.
Onpartijdigheid:
Antwoorden over opiniestukken worden vaker als partijdig beoordeeld.
Engelstalige modellen tonen meer partijdigheid, vooral in het EN-RAG-systeem.
Onderscheid feiten en meningen:
Complexere vragen worden beter beoordeeld op het maken van dit onderscheid.
RAG-systemen hebben hier minder problemen, maar Engelstalige modellen presenteren informatie vaak stelliger.
Contextuele volledigheid:
Het NL-RAG-model scoort hier het best.
Professionals verwachten meer context dan studenten, vooral bij complexe vragen.
Taalkundige kwaliteit:
Nederlandstalige modellen presteren beter dan Engelstalige.
Studenten signaleren minder vaak taalfouten dan professionals.
Kwalitatieve analyse
Feitelijke nauwkeurigheid: Onvolledige of gedateerde informatie blijft een probleem, ook bij RAG-systemen.
Onpartijdigheid: RAG-modellen nemen soms waardegeladen termen uit bronnen over, wat kan leiden tot subtiele partijdigheid.
Onderscheid feiten en meningen: Engelstalige modellen presenteren meningen vaker als feiten dan Nederlandstalige systemen.
Contextuele volledigheid: Gebrek aan essentiële uitleg of inconsistentie in antwoorden zorgt voor verwarring.
Taalkundige kwaliteit: Grammaticale fouten komen vaker voor bij Engelstalige RAG-modellen, mogelijk door vertaalstappen.
Conclusie
RAG-systemen zijn een stap vooruit voor verantwoord AI-gebruik in de journalistiek, maar het blijft cruciaal om aandacht te besteden aan nuance, context en domeinspecifieke afstemming.
Nederlandstalige modellen presteren beter vanwege hun afstemming op lokale context en culturele verwachtingen.
Verbeke, P., Eeckhout, J., Van Haverbeke, A., Van de Veire, L., & Proot, I. (2026). Large Language Models for News: Praktijkgericht wetenschappelijk onderzoek naar de prestaties van taalmodellen met RAG-integratie voor journalistieke doeleinden. Howest.
Onderzoek in de kijker
Elke maand komen er in Vlaanderen gemiddeld 16 nieuwe papers en publicaties uit rond media en communicatie. We selecteren voor jou enkele markante publicaties.