In 2014 heb ik samen met Arthur Dirksen van het Amsterdamse bedrijf Fluency gewerkt aan een text-to-speech stem. In gewoon Nederlands: een computerstem. De text-to-speech-stemmen van Fluency assisteren mensen met een visuele handicap of dyslexie bij het navigeren op hun computer, het lezen van e-mails en het invullen van documenten. Mensen met een spraakprobleem kunnen zelf weer spreken met behulp van een text-to-speech stem. Gedurende een aantal maanden heb ik pagina’s vol tekst ingesproken, nieuwsberichten, korte verhalen, literaire teksten, enzovoort. De beste klanken daaruit zijn gebruikt bij het samenstellen van de stem ‘Arno’.  
De meeste Fluency-stemmen zijn gemaakt van een beperkte hoeveelheid materiaal: 387 woorden en 387 zinnen, die bij elkaar ongeveer 3 kwartier spraak opleveren. Het is op zich bijzonder dat je met zo weinig materiaal een goede computerstem kunt maken, maar het heeft natuurlijk zo zijn beperkingen. Daarom hebben we voor deze stem veel meer tekst opgenomen dan alleen dit basismateriaal, zodat er bij het synthetiseren van een tekst veel meer geschikte spraakfragmenten gevonden worden. Een ander verschil is dat de nieuwe stem is ingesproken door een professionele stemacteur. Bron: Fluency.nl
  Probeer nu zelf (deze HTML5-player is nog volop in ontwikkeling):
<input type="edit" id="edit" size=80 value="Dit is een test."><!-- [et_pb_line_break_holder] --><!-- [et_pb_line_break_holder] --><button onClick="speakText(document.getElementById('edit').value, 'Arno', 'SpeakMsg')">Spreek</button><!-- [et_pb_line_break_holder] --><!-- [et_pb_line_break_holder] --><button onClick="stopSpeaking()">Stop</button><!-- [et_pb_line_break_holder] --><!-- [et_pb_line_break_holder] --><span id=SpeakMsg></span><!-- [et_pb_line_break_holder] -->

Nieuwe mogelijkheden met text-to-speech technologie

We zijn erg tevreden over het resultaat, maar hoe goed de stem ook is: het blijft een computerstem. Er gaat uiteindelijk niets boven het ‘echte werk’: een tekst ingesproken door een stemacteur van vlees en bloed. Maar er is natuurlijk veel meer mogelijk met een text-to-speech-stem – vooral in combinatie met een levende stem. Je zou bijvoorbeeld gepersonaliseerde welkomstboodschappen kunnen laten horen aan je bezoekers, voice response teksten combineren met dynamische informatie of voicemail teksten laten genereren voor al je medewerkers… De mogelijkheden zijn legio. Neem gerust contact met mij op.  

Nu beschikbaar

De stem ‘Arno’ is nu beschikbaar via ondermeer de Fluency TTS en Spika applicaties. Meer informatie over mijn text-to-speech stem vind je op deze speciale pagina op de website van Fluency.