Speech2Speech

Transformiert deine Stimme

Deine Stimme zählt... oder doch der Inhalt?

Kennst du das? Du nimmst einen Text auf, aber du findest deine Stimme irgendwie nicht passend? Stell dir vor, du könntest sie auf Knopfdruck in eine professionelle und fehlerfreie Computerstimme verwandeln. Unsere Speech2Speech Technologie transformiert deine Stimme in deiner eigenen Sprachgeschwindigkeit.

Speech2Speech: Zwischen Sprache, Text und Inhalt...

Unsere Speech2Speech Technologie überführt die Sprachaufnahmen einer Video- oder Audio-Datei in eine anonyme und angenehme Stimme, ohne das Original-Timing zu verlieren. Wir gehen dabei schrittweise vor:

  1. Zunächst extrahieren wir die Sprache (z. B. aus einem Video) und übersetzen die gesprochene Information in geschriebenen Text. Dieser Vorgang ermöglicht eine 100%ige Trennung von Inhalt und Stimme und führt zu der gewünschten Anonymisierung.
  2. Der geschriebene Text kann jetzt noch redigiert werden. So können eventuelle Versprecher oder Wiederholungen aus der Originalaufnahme mit Hilfe eines Texteditors einfach korrigiert werden. Auch können bestimmte Formulierungen nach Wunsch verbessert oder angepasst werden. Danach kann der geschriebene Text auch automatisch in andere Sprachen übersetzt werden.
  3. Aus dem optimalen (und eventuell übersetzten) Text erzeugen wir im dritten Schritt eine neue Sprachdatei (Text-to-Speech). Hierbei generieren wir die neuen Audio-Daten so, dass sie dem ursprünglich gesprochenen Text entsprechen. Damit bleiben Sprechdauer und ursprüngliche Pausen in der neu generierten Sprache erhalten. Somit entfällt zum Beispiel die manuelle Anpassung, wenn die neu generierte Sprache synchron zum Videos ablaufen muss.

Beispiel: Ersetzen einer Video-Sprachspur

Da bei Speech2Speech die Sprechgeschwindigkeit und Pausen erhalten bleiben, können Video-Sprachspuren nahtlos ersetzt werden. Im folgenden Beispiel wurde die original Sprache durch das Ergebnis aus der Speech2Speech-Technologie ersetzt.

Sprach-Spur gesprochen

Das Original-Video enthält eine gesprochene Audio-Spur.

Sprach-Spur Speech2Speech generiert

Hier wurde die originale Sprachspur des Videos durch die transformierte Sprache ersetzt. Die neue Sprachspur wurde nicht geschnitten oder anderweitig angepasst.

Weiteres Beispiel: kurze Audio-Datei

Dieser Text wurde über das Mikrofon aufgenommen.

Die generierte Sprache entspricht in der Audio-Länge exakt dem Original. Persönliche Stimm-Merkmale sind nicht mehr zu erkennen.

Bei der Rückwandlung des Textes in Sprache kann auch der  Sprachcharakter gewählt werden: hier wurde der Text mit weiblicher Stimme wiedergegeben.

Die in Text umgewandelte Sprache erleichtert die Übersetzung in eine beliebige Fremdsprache. Auch hier wird die Sprechdauer nicht verändert.

Hast du Interesse an unserer Technologie? Dann kontaktiere uns für eine Demonstration oder mit deinen Fragen, Ideen und Anregungen.

Cookie Consent mit Real Cookie Banner