Taaltechnologie op de Redactie

Taalalgoritmes veroverden afgelopen schooljaar de media en de lerarenkamer. Generatieve artificiële intelligentie zoals ChatGPT kunnen je bijstaan bij het herwerken van teksten, opstellen van vraagstukken of voor leerlingen bij het stiekem maken van huistaken. Maar hoe kan je die nieuwe taaltechnologieën binnenbrengen in de klas of zelfs een redactie? Combineren met podcasting, redigeren van teksten, automatisch genereren van socialmediaposts? Dat kan via een eenvoudig samenspel van Python-code en verschillende AI-modellen. Om te onderzoeken of dat perfect verloopt of eerder een veredeld spelletje ‘chinees fluisteren’ blijkt, is een snuifje kritische onderzoeksjournalistiek nodig!

 

Automatisch Transcriberen

We beginnen ons project bij een gekende uitdaging voor journalisten of makers van podcasts: het uitschrijven van een volledige transcriptie, een taak die best wat tijd kan vergen. Vaak komt het neer op aandachtig luisteren naar een audiofragment, pauzeren, noteren, terugspoelen … Rinse and repeat. Been there, done that and got the T-shirt.

Goed nieuws, dit is een repetitief karwei dat best eenvoudig te automatiseren valt door Python-code en AI-modellen! Het AI-model genaamd ‘Whisper’, ontwikkeld door OpenAI, kan een audiofragment inladen en, aan een tempo dat hoger ligt dan de menselijke verwerking, deze uitschrijven.

Dit audiofragment kan uit verschillende bronnen komen, namelijk:

  • YouTube-videofragment: een videofragment dat te vinden is via URL op de videosite YouTube. Dit videofragment wordt door een stukje Python-code gesplitst in twee delen: audio en video. Enkel het audiogedeelte wordt verwerkt door het Whisper-model.

  • Via upload: een bestand dat u staan heeft op uw eigen device. Dat kan een interview zijn dat een leerling heeft afgenomen, maar ook een stukje podcast dat ze hebben leren opnemen. U ziet, dit lesmateriaal is gemakkelijk te combineren met een lesproject rond podcasting.

  • Audiofragment in de Notebook: hierbij verwijzen we naar een pad binnen onze online Notebook om te laten verwerken.

Beperkingen

  • Tijdsduur: wanneer je een fragment automatisch wil laten transcriberen via het Whisper-model, is het aangewezen om een fragment uit te zoeken dat minder dan 15 minuten duurt. Fragmenten die deze duurtijd overschrijden kunnen tegen een beperking in het werkgeheugen binnen de Notebook aanlopen, of meer tekens genereren dan de volgende stappen in onze sequentie kunnen verwerken.

  • Fouten: bij het verwerken van een audiospoor kan het gebeuren dat het AI-model bepaalde zaken verkeerd noteert. Dit komt vaker voor in het Nederlands, zeker wanneer verschillende personen door elkaar spreken of er omgevingslawaai te horen is. Soms zijn deze fouten dodelijk om een boodschap goed te begrijpen, soms slaagt het AI-model in de volgende stap er goed in om, ietwat gelijkend op de mens, toch de betekenis uit de tekst te halen. We moeten ons wel bewust zijn dat deze ‘ruis’ voor problemen kan zorgen!

Voorbeeld:

In dit voorbeeld werd een videofragment van het YouTube-kanaal Kurzgesagt ingeladen in het AI-model. Door middel van Python-code werden het audio- en videospoor gescheiden, waarna Whisper het audiospoor omzette in tekst. Het is ook mogelijk om een Nederlandstalig audiofragment via Whisper direct om te zetten naar Engelstalige transcriptie, maar de resultaten zijn doorgaans wisselend.

Transcriptie samenvatten

De volgende stap in ons proces is het samenvatten van het interview of de podcast. Ook dit proces kan best wat tijd vergen. Een letterlijke weergave van een podcastaflevering is niet hetzelfde als een samenvatting en vice versa.

Voor deze taak sturen we de transcriptie, die we maakten aan de hand van het Whisper-model, door naar ChatGPT. Deze spreken we aan via de API of ‘application programming interface’. Dit is een soort achterdeur waardoor twee applicaties met elkaar kunnen spreken. Denk aan de integratie van jouw favoriete socialmedianetwerk in een bepaalde tool, of het direct kunnen uploaden van een video uit een videobewerkingsprogramma naar YouTube.

Via die API kunnen we het ChatGPT-model, opnieuw van OpenAI, twee instructies ofwel prompts meegeven als input, namelijk:

  • Input:

    • een instructie voor het AI-model. Om deze instructie vorm te geven baseerde ik me op onderzoek van de Universiteit van Colombia waar men onderzocht hoe GPT-tools gebruikt kunnen worden om samenvattingen te genereren. Ze onderzochten de ideale balans tussen leesbaarheid en de dichtheid van informatie en ontwikkelden daarom een prompt dat, iteratief, het model samenvattingen liet schrijven.

    • de transcriptie die we hebben gemaakt via WhisperAI en wordt doorgestuurd door een variabele (= plaats in het geheugen van de computer waar we data, zoals een tekst, kunnen opslaan) te gebruiken via de API.

  • Output:

    • een samenvatting geschreven via ChatGPT, rechtstreeks in de Notebook.

Van samenvatting naar social media!

We gingen al van het ene medium naar het andere (audio naar tekst) en van de ene tekstsoort naar de andere (transcriptie naar samenvatting). Maar een samenvatting is nu eenmaal niet zo eenvoudig te posten op sociale media zoals Instagram, TikTok of de microblogsite X (voorheen Twitter, thanks Elon …). Daarvoor gaan we, opnieuw via een AI-model, onze samenvatting omzetten naar een post voor sociale media. Met dit medium en deze tekstsoort zijn de leerlingen doorgaans goed vertrouwd.

We nemen het voorbeeld van een TikTok-post. Die zijn heel kort en krachtig, bevatten veel emoji’s zodat ze goed opvallen en doorgaans ook een ‘call to action’. Een oproep aan je volgers om mee te doen. We voeren hier een vergelijkbare stap uit als bij de vorige opdracht.

Voila! Journalisten zonder werk … toch?

Toch niet! Doorheen dit lesproject verwerken we een audio- of videofragment door drie AI-modellen. Dit kan snelle resultaten opleveren, maar soms ook lijken op een spelletje ‘fluisteren’ bij de jeugdbeweging. Doordat elke verwerking informatie weglaat, verlies je ook een deel van de betekenis. Het zijn bovendien de individuele AI-modellen die beslissen welke elementen weggelaten worden, niet de mens. Dit kan ervoor zorgen dat de uiteindelijke boodschap, bijvoorbeeld die ‘call to action’, helemaal niet meer aansluit bij de originele betekenis van het videofragment. Zo kan het gebeuren dat vermelding van de sponsor van de video opduikt in de samenvatting en in de uiteindelijke social media post!

Vertrouw niet blindelings op de objectiviteit van AI-modellen, ook al werken deze op basis van kansberekening. Kijk kritisch naar de output, beluister het audiofragment toch zelf eens, lees de samenvatting na, herschrijf deze, controleer en herschrijf de socialmediapost voor je deze online gooit …

Benodigdheden

Binnen dit lesproject kan je vrij ruim gaan in het lesmateriaal dat je gebruikt. Dit wordt vooral bepaald door het belang dat je zelf hecht aan het audiobestand en de kwaliteit ervan in het begin van ons proces. Dit kan een bestaande opname (van het internet) zijn, een opname in de klas of een opname waarvoor de leerlingen zelf een microfoon dienen te ontlenen. Dit bepaal je best zelf binnen het curriculum dat je uitbouwt binnen jouw school.

  • Microfoon via laptop, smartphone of extern;

  • Audiofragment of videofragment;

  • (School)laptop;

  • Notebook;

  • API-token voor ChatGPT van OpenAI.

Vooral deze laatste stap vergt wat werk en daarbij help ik je graag verder. Gebruik je dit liever niet, dan kan je alsnog gebruikmaken van de web interface van ChatGPT.

Leerplandoelstellingen

Voor onderstaande selectie aan leerplandoelstellingen werd gekeken naar het ontwerpleerplan ‘Taaltechnologie en Taalredactie’ binnen de richting Moderne Talen in de doorstroomfinaliteit. Dit leerplan werd gemaakt binnen de koepelvereniging ‘Katholiek Onderwijs Vlaanderen’.

  • LPD 1: De leerlingen herformuleren doelgericht schriftelijke en mondelinge teksten in functie van de doelgroep, kanaal of medium.
    Wenk: binnen deze lesopdracht dienen leerlingen een prompt te formuleren voor de AI-modellen en te reflecteren over het resultaat. Wanneer ze een samenvatting willen vragen aan een AI-model, welke kenmerken heeft zo een tekst? Wat is de doelgroep van een TikTok-post? Wanneer de output op het scherm verschijnt, bevat dit dan alle gevraagde elementen? Zo neen, moeten ze deze herschrijven.

  • LPD 2: De leerlingen analyseren hoe de context de betekenis van een taaluiting beïnvloedt.
    Wenk:
    Je kan met de leerlingen stilstaan bij verschillende vormelementen die in een taaluiting gebruikt worden, bv. interpunctie, emoji’s, hoofdletters, klemtoon … en die de betekenis kunnen beïnvloeden, zoals bij het opstellen van de prompt voor de social media post en het evalueren van de output.

  • LPD 3: De leerlingen redigeren schriftelijke teksten op taalgebruik, consistentie en doelgerichtheid.
    Wenk: Bij het verwerken van een transcriptie kunnen fouten in de tekst sluipen. Bij het genereren van een samenvatting of social media post, kunnen inconsistente zinnen opduiken of kan de output het doel van de opdracht volledig missen. Vertrouw niet blindelings op de output van deze machines en herschrijf waar nodig!
    Wenk: Het is zinvol om de leerlingen vertrouwd te maken met de mogelijkheden van actuele technologische ontwikkelingen, zoals ondersteunende (ver)taalprogramma’s of -software. Leerlingen kunnen bij dit leerplandoel dan ook gepast taaltechnologische hulpmiddelen inzetten. Je kan de leerlingen uitnodigen om beschikbare hulpmiddelen kritisch in te zetten.

  • LP4: De leerlingen gaan kritisch om met taaltechnologische hulpmiddelen.
    Wenk: In dit lesmateriaal komen leerlingen in contact met twee verschillende taalalgoritmen binnen drie opdrachten. Telkens zal een computermodel beslissingen maken over welke de precieze tekstinhoud en -vorm. Het is belangrijk om de output steeds te toetsen aan voorafbepaalde doelen en tekstkenmerken. Controleer de inhoud! Dit veronderstelt vakkennis aan de kant van de leerling.
    Wenk: Bij schrijf- en uitspraakondersteuning en bij spraaktechnologie ontdekken leerlingen wat goed en minder goed werkt en in welke situatie het interessant kan zijn om taaltechnologie te gebruiken. Je kan een koppeling maken met taalredactie door bv. een gedicteerde tekst (zie ons audiospoor en het Whisper-model) te controleren.

  • LPD 5: De leerlingen lichten het maatschappelijk en wetenschappelijk belang van taaltechnologie toe.
    Wenk:
     De leerlingen lichten toe hoe taaltechnologie het grote publiek toegang kan bieden tot informatie, cultuur en entertainment, bv. automatische vertaling van webpagina’s van overheidsdiensten, automatische ondertiteling van plenaire debatten. Hier kan je het nut van taalalgoritmes zoals het gebruikte Whisper-model toelichten.

Aan dit lesmateriaal kunnen mogelijk nog meer leerplandoelstellingen gekoppeld worden, maar bovenstaande geeft alvast een duidelijke indicatie.

Bonus: genereer automatisch toetsvragen!

In dit lesmateriaal, en het proces dat we samen met de leerlingen doorlopen, steekt ook een handige tool voor docenten. Het is namelijk mogelijk om de prompt of instructie voor het GPT-taalmodel dusdanig aan te passen om automatisch toetsvragen te genereren bij een audio- of videofragment. Uiteraard blijft de kritische reflectie nodig!

Ik wil dit in mijn klas! Wat moet ik doen?

Wil je hier zelf mee aan de slag in jouw klaslokaal? Super! Jongeren laten kennismaken met taalalgoritmen en taaltechnologie, zeker binnen een richting met focus op de moderne talen, is een belangrijk onderdeel. Via de knop hieronder kan je aansluiten bij de Discord Community waar je dit en ander lesmateriaal kan vinden!

Vorige
Vorige

AI in de Klas - Tips voor Verantwoord Gebruik en Afspraken

Volgende
Volgende

Op Avontuur met een AI!