Intelligente Lautsprecher

Smart Speaker: Assistenten von Amazon, Google & Co.

Smart Speaker sind vernetzte Laut­spre­cher, die über Sprach­befehle gesteuert werden. Pioniere der Technik sind Amazon und Google, aber auch Apple, Micro­soft und Samsung sind aktiv. Beim Daten­schutz gibt es große Bedenken.
Von / Christian Bekker / Julian Ruecker

Sprach-Assistenten und Smart Speaker - die bekanntesten Systeme Sprach-Assistenten und Smart Speaker - die bekanntesten Systeme
Fotos/Logos: Anbieter, Montage: teltarif.de
Von sprach­gesteu­erten Geräten träumt die Mensch­heit schon lange: Einfach mit einem tech­nischen Gerät spre­chen wie mit einem Menschen, ohne für die Bedie­nung die Hände benutzen zu müssen - in den vergan­genen Jahren wurde das zuneh­mend Realität. Seit Beginn der 2010er Jahre verbreiten sich sprach­gesteu­erte Geräte immens. Erst­mals wurde im Jahr 2016 ein Smart Speaker in Deutsch­land verkauft, in Öster­reich ein Jahr später. Sprachas­sistenten, die in Smart Speaker einge­baut sind, haben den Markt erobert. Für 2020 wurde erwartet, dass welt­weit 200 Millionen Smart Speaker verkauft würden. Bereits 2019 wurde ein weiterer Verkaufs­rekord erzielt, indem fast 150 Millionen Geräte verkauft wurden. Damit stellt dieser Markt eine der am schnellsten wach­senden Consumer-Tech­nolo­gien dar.

Sprach-Assistenten und Smart Speaker - die bekanntesten Systeme Sprach-Assistenten und Smart Speaker - die bekanntesten Systeme
Fotos/Logos: Anbieter, Montage: teltarif.de
Smart Speaker sind Laut­spre­cher, die mit dem Internet verbunden sind. Über die Inter­netver­bindung lässt sich per eingriffs­freier Sprach­steue­rung der intel­ligente persön­liche Assis­tent (kurz: IPA) aufrufen und beispiels­weise Musik drahtlos wieder­geben. Ferner können Smart Speaker nicht nur die im Heim­netz lokal verfüg­baren Musik- und Audio­dateien abspielen, sondern ermög­lichen auch die Wieder­gabe von Musik­strea­ming-, Nach­richten-, Podcast- bzw. sons­tigen Audio-Diensten, die im Internet verfügbar sind.

Über die Laut­spre­cher ist aller­dings nicht nur die Wieder­gabe möglich: Auch die Bedie­nung von Smart-Home-Kompo­nenten, z. B. die Steue­rung der Beleuch­tung oder von Heizungen sind reali­sierbar. Darum werden Smart Speaker inzwi­schen oft auch im Paket mit Smart-Home-Geräten oder als Ergän­zung zu Touch-gesteu­erten Smart-Home-Zentral­einheiten verkauft. In einem sepa­raten Ratgeber führen wir aus, dass Sie viele sprach­gesteu­erte Smart-Home-Tech­niken auch als Mieter instal­lieren und nutzen können.

Bereit­schafts­modus und Funk­tions-Erwei­terung per "Skill"

Smart Speaker sind so konzi­piert, dass sie auch im Bereit­schafts­modus das gespro­chene Wort im Raum zumin­dest gerä­tein­tern verar­beiten und auf ein Signal­wort warten, um in den aktiven Modus zu wech­seln - die bewusste Sprach­steue­rung kann oftmals auch direkt durch das Drücken einer Akti­onstaste erfolgen. Viele Hersteller verwenden hierzu expli­zite Akti­vierungs-Befehle, am bekann­testen dürften wohl "Alexa, ...", "Ok, Google ..." oder "Hey Siri, ..." sein.

Das setzt voraus, dass das Mikrofon eines Smart Spea­kers dauer­haft einge­schaltet ist und "mithört", auch wenn gerade gar kein direkter Befehl an das Gerät gegeben wird. Da vielen Nutzern das (insbe­sondere in Räumen wie dem Schlaf­zimmer) unheim­lich vorkommt, verfügen einige Smart Speaker mitt­lerweile über einen physi­schen Mikrofon-Button, mit dem sich das Mikrofon abschalten lässt.

Smart Speaker sind übri­gens nicht auf die Funk­tionen beschränkt, die der Entwickler ihnen beigebracht hat. So wie Apps zahl­reicher Entwickler Smart­phones berei­chern, so ergänzen selbst program­mier­bare "Skills", also "Fähig­keiten" einen Smart Speaker. Für die Entwick­lung von Skills halten die Hersteller spezi­elle Deve­loper-Platt­formen und Anlei­tungen bereit.

Eigener Laut­spre­cher oder Assis­tent "built-in"?

Nicht alle Entwickler von Assistenten haben auch eigene Lautsprecher Nicht alle Entwickler von Assistenten haben auch eigene Lautsprecher
Fotos: Apple/Google/Amazon, Montage: teltarif.de
Inter­essant ist die Entwick­lung, dass Assis­tenten wie Apple Siri, Micro­soft Cortana und Samsung Bixby zunächst in die jewei­ligen Smart­phone- und Laptop-Betriebs­systeme imple­mentiert wurden. Amazon, Google und die Deut­sche Telekom haben ihre Assis­tenten hingegen primär über Laut­spre­cher­modelle unter eigenem Namen vermarktet, wobei die Telekom ihren Smart Speaker inzwi­schen wieder einge­stellt hat.

Insbe­sondere Musik­lieb­habern ist aber ziem­lich schnell aufge­fallen, dass es zwar ein toller Service ist, den Smart Speaker auf Zuruf die eigene Musik abspielen zu lassen, dass die Klang­qua­lität der meist preis­werten Laut­spre­cher für anspruchs­volle Ohren aber recht bescheiden ist. Darum gibt es immer mehr Hersteller quali­tativ hoch­wertiger Audio- und Video-Kompo­nenten wie Laut­spre­cher, Receiver, Sound­bars oder Fern­seher, die die Sprachas­sistenten inte­grieren - man spricht dann beispiels­weise von "Alexa built-in".

Aktuell geht die Entwick­lung dahin, dass immer mehr Hersteller sogar mehrere Assis­tenten gleich­zeitig imple­mentieren (also zum Beispiel Google Assi­stant und Amazon Alexa auf demselben Gerät). Speziell die Soft­ware von Google und Amazon ist für fast alle Platt­formen verfügbar. Inzwi­schen inte­grieren auch Haus­geräte-Hersteller die smarten Assis­tenten - und auch im Auto finden diese zuneh­mend Verbrei­tung.

Bekannte Sprachas­sistenten in der Über­sicht

  Amazon Apple Google Micro­soft Samsung
Sprach-Assis­tent Alexa Siri Assi­stant Cortana Bixby
eigene Produkt­reihe Echo HomePod mini Nest
(ehem. Home)
nur in
Surface-Geräten
nur in
Smart­phones
und ausge­wählten Tablets sowie Smart-TVs
in Geräten von Dritt­anbie­tern ja ja 1) ja ja
(Bestand­teil von Windows und 365)
nein 2)
Stand: Juli 2023
1) Beispiels­weise kann Siri mit Ecobee verknüpft werden.
2) Steue­rung div. Dritt­anbieter-Geräte mit Bixby über die SmartThings-App möglich.

Abge­tippte Aufzeich­nungen und Kritik von Daten­schüt­zern

Die Smart Speaker verfügen fast immer über leis­tungs­fähige Hard­ware, die die Sprach­befehle mittels mehrerer Mikro­fone aufzeichnet. Das bedeutet, dass auch aus relativ großer Entfer­nung sowie bei einem erhöhtem Hinter­grund­geräusch­pegel Audio­aufnahmen erzeugt werden. Die Aufnahmen werden anschlie­ßend auf zentralen Servern verar­beitet. Solange die Mikrofon-Funk­tion aktiv ist, wird die Umge­bung ständig auf dem Gerät abge­hört und die letzten Sekunden werden auf dem Gerät aufge­zeichnet. Die Aufnahmen werden also nicht im Gerät, sondern beim entspre­chenden Anbieter verar­beitet und gespei­chert.

Die Hersteller berufen sich darauf, dass Mikro­fone mit der Stumm­funk­tion hart­verdrahtet und ein uner­wünschtes Abhören nicht möglich sei. Aller­dings wurde bereits medi­enwirk­same Berichte veröf­fent­licht, nach denen Amazon, Google & Co. an der spre­cher­spezi­fischen Erken­nung mensch­licher Stimmen forschen und im Rahmen dieser Forschung auch private Gespräche aufge­zeichnet wurden.

Dies kam dadurch zum Vorschein, dass Mitar­beiter mehrerer Hersteller an die Öffent­lich­keit gegangen sind und darüber berichtet haben, dass es ihre Aufgabe sei, private Sprach­aufzeich­nungen von Nutzern anzu­hören, abzu­tippen und "zum Zweck der Soft­ware-Verbes­serung" wieder an den Hersteller zu schi­cken. Dabei haben die Mitar­beiter intimste persön­liche Details und sogar mutmaß­liche Straf­taten mitge­hört, was Daten­schützer auf den Plan gerufen hat. Kritiker spre­chen von einer "Wanze im Wohn­zimmer". Ein behut­samer Umgang mit smarten Assis­tenten ist also empfeh­lens­wert.