Aktuelles
Digital Eliteboard - Das Digitale Technik Forum

Registriere dich noch heute kostenlos, um Mitglied zu werden! Sobald du angemeldet bist, kannst du auf unserer Seite aktiv teilnehmen, indem du deine eigenen Themen und Beiträge erstellst und dich über deinen eigenen Posteingang mit anderen Mitgliedern unterhalten kannst! Zudem bekommst du Zutritt zu Bereichen, welche für Gäste verwehrt bleiben

Registriere dich noch heute kostenlos, um Mitglied zu werden! Sobald du angemeldet bist, kannst du auf unserer Seite aktiv teilnehmen, indem du deine eigenen Themen und Beiträge erstellst und dich über deinen eigenen Posteingang mit anderen Mitgliedern unterhalten kannst! Zudem bekommst du Zutritt zu Bereichen, welche für Gäste verwehrt bleiben

Hardware & Software Text-zu-Sprache in hoher Qualität für Audio- und Video-Projekte

Abogen – Text-zu-Sprache in hoher Qualität für Audio- und Video-Projekte

Du musst Regestriert sein, um das angehängte Bild zusehen.


Abogen ist ein leistungsstarkes Open-Source-Tool zur automatischen Umwandlung von Text in natürlich klingende Sprache. Innerhalb weniger Sekunden lassen sich unterschiedlichste Textquellen in hochwertige Audiodateien mit passenden Untertiteln umwandeln. Unterstützt werden unter anderem ePub- und PDF-Dokumente, klassische Textdateien, Markdown-Dateien sowie Untertitel im SRT-Format.

Das Tool eignet sich besonders für die Erstellung von Hörbüchern, Voice-over-Spuren für Social-Media-Plattformen wie Instagram, YouTube oder TikTok sowie für alle Projekte, bei denen eine realistisch klingende Sprachausgabe benötigt wird. Zum Einsatz kommt das Sprachmodell Kokoro-82M, das für eine sehr natürliche Betonung und flüssige Aussprache sorgt.

Ein weiterer Vorteil von Abogen ist die automatische Generierung synchroner Untertitel. Dadurch lassen sich Audio- und Videoinhalte barriereärmer gestalten oder direkt weiterverarbeiten, etwa für Videos mit eingeblendeten Texten. Dank der offenen Struktur ist das Tool flexibel erweiterbar und kann lokal betrieben werden, was besonders für datenschutzbewusste Nutzer interessant ist.

Abogen richtet sich sowohl an Content-Creator als auch an Entwickler und bietet eine effiziente Möglichkeit, große Textmengen schnell und zuverlässig in gesprochene Inhalte zu verwandeln.

Quelle:
github.com
 
Zurück
Oben