Exploring infrastructure for Dutch speech recognition
Door ontwikkelingen in AI verandert de wereld van automatische spraakherkenning (ASR) snel. Nieuwe ASR-systemen lijken een overweldigend nauwkeurige transcriptie van spraak te leveren. Maar hoe presteren deze systemen onder atypische omstandigheden en in grootschalige toepassingen?
- 25 jun 2024
-
Tijd13:00-17:00u.
-
PlaatsSURF Utrecht
ASR-systemen die recentelijk op de markt zijn gekomen, zoals Whisper, lijken een overweldigend accurate transcriptie van spraak te leveren. Maar hoe presteren deze systemen onder atypische omstandigheden? Bijvoorbeeld in het geval van dialecten, kindertaal, spraak van ouderen of spraak van niet-moedertaalsprekers? Wat gebeurt er als er meerdere sprekers zijn of achtergrondgeluiden? En wat moet je doen als je zeer grote hoeveelheden spraakgegevens wilt transcriberen? Wat is de beste manier om dit op een meer (infra)structurele manier aan te pakken?
In dit seminar tonen we voorbeelden uit verschillende toepassingsgebieden en bespreken we praktische, operationele en strategische aspecten van:
- De noodzaak van het beschikbaar maken van hoogwaardige (Nederlandse) spraakherkenningsengines in onderzoeks- en onderwijscontext, bijvoorbeeld om spraak uit colleges, interviews of vergaderingen te transcriberen naar tekst.
- Of het al dan niet belangrijk is dat spraakherkenningsengines kunnen worden ge-update wanneer betere engines of modellen beschikbaar komen, of dat verschillende versies van modellen kunnen worden geselecteerd voor specifieke taken (bijv. specifieke soorten spraak).
- Hoe open standaarden toegepast kunnen worden en 'Explainability' zoveel mogelijk bevorderd kan worden (hoe worden modellen gemaakt, met welke datasets, prestatiespecificaties).
Dit seminar heeft niet als doel om onderzoek naar spraaktechnologie te faciliteren, maar richt zich op het gebruik van bestaande spraaktechnologie-oplossingen, en hoe dit (verder) gefaciliteerd kan worden: laten we naar duurzame oplossingen zoeken voor onderzoek en onderwijs!
Programma
Voorzitter: Annette Langedijk (SURF)
12:45u. | Inloop |
13:00u. | Welkom en Setting the Stage (Roeland Ordelman, CTO CLARIAH) |
13:10u. |
Gebruikersperspectieven op ASR
|
14:30u. | Pauze |
15:00h |
Technologische perspectieven op ASR
|
15:50h | Paneldiscussie |
16:30h | Afsluiting en netwerkborrel |
Noot: De voertaal van de bijeenkomst is Engels.
Voor wie?
Het evenement is met name interessant voor:
- Onderzoekers, docenten en ondersteunend personeel uit verschillende disciplines die geĆÆnteresseerd zijn in de toepassing van automatische spraakherkenning
- Aanbieders van onderzoeks- en onderwijsinfrastructuur
Locatie
SURF Utrecht (Kantoren Hoog Overborch - Hoog Catharijne)
Moreelsepark 48
3511 EP Utrecht
Routebeschrijving
Organisatie
SURF in samenwerking met Stichting Open Spraaktechnologie.