Seite 1 von 1

Wie wurde die Alexa-Stimme aufgenommen?

Verfasst: Mi 11. Okt 2017, 07:21
von jaspart
Hallo zusammen,

Alex spricht meiner Meinung nach deutliche besser und natürlicher als der Google Assistant.

Aber woher kommt die Stimme? Habe dazu nichts gefunden bei Google. Ist doch eine Sprachsythese, oder?

Ich habe nämlich zuletzt ein paar Synchronsprecherinnen kennengelernt, die erzählt haben, sie hätten für Alexa jeweils viele hundert Sprachtakes eingesprochen. Aber Alexa hat ja zum einen nicht mehrere Stimmen, sondern nur eine. Und zweitens kann sie ja auch Texte vorlesen und nicht nur vordefinierte Sätze sprechen. Aber vielleicht waren die ganzen Phrasen der Sprecherinnen die Grundlage für die Sprachsynthese?

Re: Wie wurde die Alexa-Stimme aufgenommen?

Verfasst: Mi 11. Okt 2017, 10:16
von rasenlatscher
Kann deine Frage nicht direkt beantworte, denke mir aber das für Sprachsynthese dennoch als Ausgangspunkt eine echte menschliche Stimme genommen wird.

Also auf der Wikipedia Seite
https://de.wikipedia.org/wiki/Amazon_Echo
wird auf genau eine Sprecherin verwiesen:

"Die Sprachaufnahmen, welche die Grundlage für die Stimme der Software bilden, erfolgten im polnischen Danzig. Dort hatte Amazon 2013 das Start-up Ivona übernommen, das die entsprechende Technik entwickelte. Die deutsche Stimme ist die einer Profisprecherin, die seitdem exklusiv für Amazon arbeitet. Der Konzern hält ihre Identität geheim"
Philipp Alvares de Souza Soares: Hey Alexa. In: manager magazin. Nr. 2, 20. Januar 2017, S. 80–83.

Aber vielleicht haben deine Synchronsprecherinnen auch etwas für Amazon Lex eingesprochen. Ist die Sprachsynthese hinter Alexa, die man auch direkt nutzen kann.

Re: Wie wurde die Alexa-Stimme aufgenommen?

Verfasst: Mi 11. Okt 2017, 11:40
von MK2101
Hier der Link zum Artikel im Manager Magazin: http://www.manager-magazin.de/magazin/a ... 43884.html

Ich habe irgendwo auch mal einen anderen Bericht über das Unternehmen in Polen gelesen. In diesem Bericht wurde gesagt, dass die Sprecherin hunderte von sinnlosen Sätzen einsprechen musste um den Tonfall und die Betonung der einzelnen Wörter und Silben herauszuarbeiten. Es kann natürlich auch sein, dass andere Sprecher das gleiche machen mussten um ein ausgewogenes Ergebnis zu erhalten.

Re: Wie wurde die Alexa-Stimme aufgenommen?

Verfasst: Mi 11. Okt 2017, 12:30
von nachtanbeterin
Wobei bei meiner Alexa das " morgen" bei Wecker gestellt 4:30 Uhr morgen früh ,sich schon ein bisschen komisch anhört ;)

Re: Wie wurde die Alexa-Stimme aufgenommen?

Verfasst: Fr 10. Jul 2020, 12:53
von rejesyy
Ich muss diesen Beitrag noch ergänzen, denn ich habe etwas herausgefunden. Die Alexa Sprecherin ist eine echte Stimme und heißt (ich bin mir zu 80% sicher, dass sie es ist) Djuwita Müller.

Wenn man sich auf Ihrer Homepage http://www.djuwitamueller.de/ die Demo "Hörbeispiel Imagefilm" anhört, erkennt man (zumindest ich) sehr schnell, dass es sehr verdächtig nach der Stimme von Alexa klingt. Das erklärt bestimmt auch, warum sie seit mehreren Jahren von vielen Hörfunkstationen als Stationvoice verschwunden ist.

Was denkt ihr?

LG David

Re: Wie wurde die Alexa-Stimme aufgenommen?

Verfasst: Mi 29. Jul 2020, 15:41
von Der_Dedl
Ich denke, dass du falsch liegst.
Diese Dame kann man immer noch buchen.
Die Alexa Sprecherin arbeitet aber exklusiv für Amazon.

Re: Wie wurde die Alexa-Stimme aufgenommen?

Verfasst: Mi 5. Aug 2020, 21:01
von Echologe
Mir ist schon seit längerem aufgefallen, dass Alexas Stimme teilweise sehr unterschiedlich klingt.

Beispielsweise beim Einrichten eines Echos (zumindest noch vor ein paar Wochen) und auch wenn Alexa "Kindergeschichten" erzählt, entspricht ihre Stimme tatsächlich zu 100 % der Stimme der Sprecherin Djuwita Müller (Hörbeispiel TV Werbung 1 und Image Film auf Ihrer Homepage). Die "alltägliche" Stimme von Alexa klingt aber etwas anders. Just my 2 cents!

Re: Wie wurde die Alexa-Stimme aufgenommen?

Verfasst: Do 6. Aug 2020, 00:03
von padrino
Ich denke, es gibt "zwei Stimmen" (sicher aus der selben Quelle ;)), einmal die sythetisierte "Alltagsstimme", die alles aus phonen zusammen setzt und dann gibt es Aufzeichnungen, wo die Sprecherin den Text am Stück eingelesen hat.