In 2014 heb ik samen met Arthur Dirksen van het Amsterdamse bedrijf Fluency gewerkt aan een text-to-speech stem. In gewoon Nederlands: een computerstem.
De text-to-speech-stemmen van Fluency assisteren mensen met een visuele handicap of dyslexie bij het navigeren op hun computer, het lezen van e-mails en het invullen van documenten. Mensen met een spraakprobleem kunnen zelf weer spreken met behulp van een text-to-speech stem.
Gedurende een aantal maanden heb ik pagina’s vol tekst ingesproken, nieuwsberichten, korte verhalen, literaire teksten, enzovoort. De beste klanken daaruit zijn gebruikt bij het samenstellen van de stem ‘Arno’.
De meeste Fluency-stemmen zijn gemaakt van een beperkte hoeveelheid materiaal: 387 woorden en 387 zinnen, die bij elkaar ongeveer 3 kwartier spraak opleveren. Het is op zich bijzonder dat je met zo weinig materiaal een goede computerstem kunt maken, maar het heeft natuurlijk zo zijn beperkingen. Daarom hebben we voor deze stem veel meer tekst opgenomen dan alleen dit basismateriaal, zodat er bij het synthetiseren van een tekst veel meer geschikte spraakfragmenten gevonden worden. Een ander verschil is dat de nieuwe stem is ingesproken door een professionele stemacteur. Bron: Fluency.nlProbeer nu zelf (deze HTML5-player is nog volop in ontwikkeling):