AI-skolan

Vad är
Text-to-speech

Text-to-speech (TTS) är teknik som omvandlar skriven text till talat ljud. Moderna TTS-system använder neurala nätverk för att generera röster som låter naturliga och mänskliga, med korrekt betoning, prosodi och känsla — långt ifrån de robotlika rösterna från tidiga system. TTS används i röstassistenter, e-böcker, tillgänglighetsverktyg och kundservice.

Exempel

Tjänster som ElevenLabs kan ta en textmanus och generera ett podcastavsnitt i din egen röst — om du har gett ett kortare röstprov som referens. Tillgänglighetsverktyg i telefoner och datorer använder TTS för att läsa upp skärmen för synskadade användare.

AI
Verktyg