Digital Eliteboard - Das Digitale Technik Forum

Registriere dich noch heute kostenloses um Mitglied zu werden! Sobald du angemeldet bist, kannst du auf unserer Seite aktiv teilnehmen, indem du deine eigenen Themen und Beiträge erstellst und dich über deinen eigenen Posteingang mit anderen Mitgliedern unterhalten kannst! Zudem bekommst du Zutritt zu Bereiche, welche für Gäste verwehrt bleiben

Hardware & Software eigene Stimme in wenigen Minuten kostenlos sichern

Mit Acapela kann jeder seine eigene Stimme in wenigen Minuten kostenlos sichern – nur für den Fall der Fälle​


1685704987622.png

Synthetische Sprache kann heutzutage ein furchteinflößendes Objekt sein, wenn sie mit Deepfakes und anderen KI-Täuschungen gepaart wird, aber sie ist auch ein unverzichtbares Werkzeug für alle, die nicht mehr alleine sprechen können. Die Acapela Group hat diese Leute mit ihrem neuen "
Du musst dich Anmelden oder Registrieren um diesen link zusehen!
-Dienst im Blick, mit dem jeder
Du musst dich Anmelden oder Registrieren um diesen link zusehen!
kann.

Acapela ist seit rund 25 Jahren im Text-to-Speech-Bereich tätig und wurde kürzlich vom Tech-Accessibility-Giganten Tobii Dynavox übernommen, obwohl sie immer noch unabhängig arbeiten.

Wie in vielen Branchen wurde auch die Barrierefreiheit stark durch das Aufkommen von maschinellen Lernprozessen im Verbrauchermaßstab beeinflusst. Vor sieben oder 8 Jahren, erinnert sich Acapela-Mitbegründer Remy Cadic, war es nicht nur mühsam, eine synthetische Stimme für sich selbst anzupassen, sondern die Ergebnisse waren auch nicht besonders gut.

"Es war sehr zeitaufwändig – der Patient musste 8 Stunden lang trainieren. Jetzt können wir eine Stimme mit nur 50 aufgezeichneten Sätzen speichern. Es dauert etwa 10 Minuten und die Stimme ist am nächsten Tag fertig", sagte er. "Es ist definitiv eine Revolution im Gange bei neuronalen Text-to-Speech-Techniken."

Einen Sprachgenerator zu haben, der die eigene Stimme verwendet, ist sicherlich etwas, das eine wachsende Zahl von Menschen zu schätzen weiß – die Auswahl aus einer Liste ist ein bisschen entmenschlichend. Viele haben Stimmen, die sie lieber verwenden würden, aber erst vor kurzem war es eine Option.

Sie machten keine Witze darüber, wie schnell und einfach es ist: Ich durchlief den neuen Prozess "meine eigene Stimme", und es waren wirklich nur 50 kurze Sätze, die aus einem (zufälligen, wie es schien) Korpus von Romanen, Rezeptbüchern und Artikeln stammte. Die Aufnahmeoberfläche war einfach und leicht zu navigieren, und tatsächlich, etwa einen Tag später war meine Stimme einsatzbereit. Die Qualität ist in Ordnung – nicht unheimlich wie einige Modelle da draußen, aber eindeutig meine eigene Stimme (wie beworben) und in der Lage, jeden Satz zu verarbeiten, den ich auf der Demo-Seite darauf geworfen habe.

Jetzt, wo es da ist, kann ich, wenn ich es jemals brauche, es gegen eine Gebühr herunterladen, um es auf jedem kompatiblen Spracherzeugungssystem zu verwenden. Dazu gehören natürlich auch Tobii Dynavox's TD Talk und Geräte; Das Unternehmen
Du musst dich Anmelden oder Registrieren um diesen link zusehen!
– diese Dinger werden ziemlich elegant.

Und das ist der eigentliche Sinn von all dem – es ist keine technische Demonstration der Leistungsfähigkeit der neuronalen Sprachtechnologie oder eine Demo, bei der jeder sie mit einer prominenten Stimme füttern kann, um sie zu klonen. Es ist ein Tool, das speziell für Menschen entwickelt wurde, die bis vor kurzem keine oder bestenfalls einen schwierigen, komplexen Prozess hatten, wenn sie ihre Stimme bewahren wollten.

Viele, die mit degenerativen Erkrankungen, Krebs oder bestimmten Eingriffen konfrontiert sind, wissen, dass sie innerhalb weniger Monate oder Jahre möglicherweise nicht mehr gut oder gar nicht mehr sprechen können. Den Prozess des Bankings ihrer Stimme so einfach wie möglich zu gestalten, ist ein Service, den viele zu schätzen wissen.

"Ein großer Vorteil ist, dass wir sie auch an Kinder anpassen können – wir haben das Aufnahmeskript leichter lesbar gemacht und das System so abgestimmt, dass die Qualität der synthetischen Stimmen von Kindern verbessert wird. Wir waren die ersten auf der Welt, die das getan haben, und wir gehen immer noch in diese Richtung", sagte Cadic.

In der Lage zu sein, die Banked Voice aufzunehmen und neu aufzunehmen oder künstlich altern zu lassen, ist eine neue und herausfordernde Fähigkeit, aber eine, die Ergebnisse zu erzielen scheint:

Die Kompatibilität mit Offline-Geräten, die nicht über den neuesten neuronalen Verarbeitungschip verfügen, ist ebenfalls ein wichtiges Unterscheidungsmerkmal. "Es gibt Online-Lösungen, bei denen es einfach ist, eine Stimme zu erstellen, aber sie ist nur über die Cloud verfügbar, und das ist einfach nicht praktikabel", sagte er.

Übrigens, während das 50-Satz-Ding großartig für Leute ist, die noch lesen und sprechen können, kann eine Stimme auch mit Sprachaufnahmen von Menschen trainiert werden, die diese Fähigkeit inzwischen verloren haben – es ist nur nicht ganz so einfach.

Das Unternehmen hat auch festgestellt, dass Vielfalt und Rücksichtnahme im Trainingsprozess genauso wichtig sind wie bei anderen KI-Anwendungen. Cadic wies darauf hin, dass ein Problem bei einigen superschnellen Trainingstechniken darin besteht, dass "so ziemlich nur versucht wird, den Sprecher im Schulungsmaterial zu finden, der dem Benutzer am nächsten ist. Aber wenn es im Training keinen Sprecher gibt, der der Originalstimme nahe kommt, wird es einfach nicht so klingen."

Nicolas Mazars, Produktmanager bei Acapela, fügte hinzu, dass dieses Problem, wie viele KI-Probleme, die auf unzureichende Trainingsdaten zurückzuführen sind, nicht gleichmäßig verteilt ist: "Dieser Prozess funktioniert gut für den durchschnittlichen 50-jährigen Weißen, aber nicht, wenn Sie ein afroamerikanischer Mann sind oder nicht gut Englisch sprechen. Wir arbeiten in 23 Sprachen und haben viele Benutzer mit Behinderungen. Wir versuchen, uns auf das Feedback der Nutzer zu verlassen und etwas für sie zu entwickeln, von ihnen."

Der Erfassungs- und Bankvorgang ist kostenlos;
Du musst dich Anmelden oder Registrieren um diesen link zusehen!
und Ihre eigene synthetische Stimme in wenigen Minuten trainieren. Sie zahlen nur, wenn Sie es herunterladen und auf einem Gerät installieren möchten. ...

Quelle: Techcrunch.com
 
Zuletzt bearbeitet:
Zurück
Oben