Go to Menu

ReadSpeaker tekst-naar-spraakstemmen

Ontdek ReadSpeakers portfolio van tekst-naar-spraakstemmen, dat wordt gezien als een van de meest accurate en realistische op de markt. Vraag ook naar onze custom voices, stemmen die we ontwikkelen voor exclusief gebruik.

Contact

Laat je eigen tekst voorlezen door een ReadSpeaker stem

Met deze demo kan je zelf tekst invoeren en laten voorlezen. Probeer onze talen en stemmen uit!

Niet alle hier beschikbare talen en stemmen zijn beschikbaar voor alle ReadSpeaker oplossingen. En er zijn nog meer stemmen voor sommige oplossingen dan in deze demo. Zie onze Talen en stemmen pagina voor een overzicht van welke talen beschikbaar zijn per oplossing.

Taal selecteren
Stem

ReadSpeaker TTS-stemmen (TTS:Text to Speech) zijn realistische, herkenbare stemmen. Er zijn meer dan 110 stemmen beschikbaar in ruim 35 talen. En we werken continu aan meer. Maak kennis met de ReadSpeaker TTS-familie van hoogwaardige voice persona’s en stel ze op de proef.

Toonaangevende TTS-stemmen

Onze passie is het ontwikkelen van hoogwaardige TTS-stemmen. Wij zijn er trots op, dat externe experts de Amerikaans-Engelse ReadSpeaker TTS-stem beoordelen als de meest accurate stem op de markt. Ook enthousiaste reacties van onze klanten bevestigen dat we de allerbeste TTS-oplossingen leveren. Zo dragen we bij aan het succes van online, offline, embedded en server-gebaseerde applicaties over de hele wereld. Onze toewijding om uitstekende TTS-oplossingen te bieden, wordt ondersteund door ons compromisloze productieproces. Dit proces waarborgt het kwaliteitsniveau waarop klanten uit de hele wereld en uit diverse markten al jaren vertrouwen.

Hoe onze TTS-stemmen worden gemaakt

Om onze voice persona’s te creëren, selecteren we professionele stemacteurs en nemen hun stemmen op. De stemacteur gaat gedurende een aantal dagen of weken aan de slag met ons ontwikkelteam, afhankelijk van het type stem dat we willen bouwen en de technologie die we daarvoor inzetten. Voor de opnames ontwikkelen we een gevarieerd script waarin alle klankpatronen voorkomen die bestaan in de specifieke taal. Het team volgt het opnameproces van dichtbij en controleert continu op consistentie in uitspraak, accent en stijl.

USS-stemmen

Tot ongeveer 2019 gebruikten wij voor het creëren van hoogwaardige stemmen een techniek die Unit Selection Synthesis (USS) wordt genoemd. Deze stemmen worden nog steeds gebruikt in de meeste van onze SaaS-oplossingen, zoals webReader en docReader. Om een USS-stem te maken, wordt de audio die met de stemacteur is opgenomen gesegmenteerd, dat wil zeggen verdeeld in kleine stukjes (units), zoals zinnen, woorden, lettergrepen en fonemen (klinker- of medeklinkerklanken).
Aan de resulterende spraakdatabase wordt vervolgens een rijke annotatie toegevoegd. De units worden voorzien van Informatie over de klemtoon (kwam deze unit uit een beklemtoonde of onbeklemtoonde lettergreep?), de positie van de unit in het woord of de zin, enz.
Deze annotaties worden vervolgens door ons slimme technische team geoptimaliseerd met behulp van o.a. Kunstmatige Intelligentie (AI) en Machine Learning op basis van grote hoeveelheden data. Onze state-of-the-art methodes worden aangevuld met de taalkundige expertise van ons team. De ReadSpeaker TTS-engine gebruikt de resulterende database om tekst om te zetten in spraak: units uit de spraakdatabase worden zodanig aan elkaar ‘geplakt’ dat een hoogwaardige synthetische stem de tekst kan uitspreken.
Zo wordt een nieuwe ReadSpeaker voice persona geboren. Het proces eindigt hier echter niet. Eén van de unieke eigenschappen van ReadSpeaker is ons voortdurende verbeteringsproces. Hoogwaardige feedback en een grondig Quality Assurance proces met native-speaker experts zorgen ervoor dat eventuele imperfecties voortdurend worden verbeterd.

Neurale stemmen

ReadSpeaker bouwt sinds enkele jaren vooral neurale stemmen met gebruik van Deep Learning. Deep learning is een discipline van machine learning, waarin gelaagde neurale netwerken leren van grote hoeveelheden data. Deze revolutionaire technologie gebruikt Deep Neural Networks (DNN’s) om linguïstische eigenschappen te koppelen aan akoestische kenmerken. DNN-technieken maken gebruik van een iteratief leerproces om objectief meetbare verschillen tussen de voorspelde akoestische kenmerken en de waargenomen akoestische kenmerken in de trainingsset te minimaliseren. Een van de voordelen van DNN is dat de akoestische database veel kleiner kan zijn dan voor een USS-stem. Voor een neurale stem hebben we maar enkele uren opgenomen spraak nodig. Voor een goede USS-stem minstens driemaal zoveel. Stemmen ontwikkeld met deze techniek klinken bovendien vloeiender en menselijker. Zo kunnen we sneller dan ooit nieuwe, slimme ReadSpeaker TTS-stemmen ontwikkelen met nog levensechtere, expressievere spraak en aanpasbare intonatie.

Custom voices

Wil je je klanten een unieke user experience bieden en je merkwaarde vergroten? Een van de krachtigste manieren om je te onderscheiden is met een unieke, eigen stem voor jouw merk. Een custom voice maakt jouw merk uniek en schept een krachtige band met je klanten, ongeacht het gebruikte communicatiekanaal. De stem van een favoriete BN’er of andere specifieke persoon koppelen aan jouw merk? ReadSpeaker kan van haar of zijn stem een synthetische stem creëren zodat je deze stem altijd kan gebruiken voor een unieke en onmiddellijk herkenbare interactie met je klant.