Warum sind Skills für Amazon Echo derzeit noch so Sch*****?
Schon von Haus aus hat Alexa ein paar interessante Funktionen die mehr oder minder gut funktionieren, auch wenn da natürlich noch wesentlich mehr geht. Um dieses mehr auch mehr werden zu lassen, lässt sich Alexa mit nachinstallierbaren Skills aufrüsten. Jedoch macht das aktuell kaum Spaß. Warum?
Icons made by Freepik
In erste Linie, ist es der normale Weg den ein neue Technologie zu gehen hat. Kennt noch jemand die ersten Apps fürs Smartphone? Genau! Die waren zum größten Teil auch erstmal ziemlich großer Schrott. Erst mit der Zeit ist die Technologie gereift und damit auch deren Entwickler und dessen Apps.
Alexa geht es hier nicht anders. Wobei es für die Entwickler jedoch neben den technologischen Grenzen noch ein gänzlich anderes/neues Problem gibt; das Verständnis der menschlichen Sprache! Nein, das liegt nicht daran das Programmierer irgendwelche Morloks in dunkeln, nassen und miefigen Kellern sind die sich von Pizza ernähren (Diese Zeiten sind im übrigen schon seit den 90ern vorbei). Es liegt daran das Ligusistik numal eine komplexe Wissenschaft ist und ein jeder Mensch, auch Entwickler… zwar sehr viel können und wissen, aber eben auch nicht alles. Auch Marc Zuckerberg oder Larry Page nicht (Nagut, die Ehefrau evtl. schon!).
Schaut man sich die Entwicklung vom Computer zum Smartphone an, so war dieser Schritt eigentlich in seinem Grundprinzip nicht wirklich groß. Beides hat Bildschirm, Tastaur und Maus/Touchpad. Dies ist bei Sprachassistenten schonmal gänzlich anders. Hier gilt „Voice First“ und damit gibt es dann als einziges Kommunikationsmittel eben nur die Sprache. Womit auch klar ist, das alleine über Sprache eben nicht alles mitgeteilt werden kann. Ein Bild oder eine Farbe kann man nur schwer versprachlichen. So hat auch Amazon selbst im Grunde noch zahlreiche Stolperfallen indem eine App zur Konfiguration von Alexa eingesetzt werden muss. Auch hier existiert entsprechend von Haus aus schon ein Medienbruch, weil eben nicht alles über Sprache konfigurierbar gemacht wurde.
Die Entwickler sind es gewohnt in Hierachien, Schlagworten, Klicks und Bildern zu entwicklen und zu denken. Dabei müssten sie eigentlich in Phrasen und in Kontexten denken. Ein jeder von uns hat sich bei einem Anruf schonmal durch einen Telefonassistenten „Bei Bla, drücken sie Blubb!“ durchkämpfen müssen. Mit menschlicher Sprache hat das Nichts zu tun. Genau so sehen fast alles derzeit erhältlichen Skills auch aus.
Die besser bewerteten Skills sind oft die Skills, die eigentlich nicht wirklich Sprache brauchen und in die Kategorie Smart Home gehören. Viel mehr als „An“, „Aus“ oder „zu 50%“ sind da kaum gefordert und eben auch nicht drinn. Logisch das diese Skills ausreichend gut funktionieren. Was wäre wenn ein solcher Skill auf die folgende Sache reagieren müsste? „Alexa, stell die Heizung bitte so ein, das mir nicht mehr kalt ist!“. hm!?
Menschliche Sprache ist auf viele Arten komplex. Die Maschine kann dies (noch) nicht wirklich einordnen und damit umgehen. Dazu kommen die technologischen Grenzen der digitalen Sprachassistenzsysteme selbst. Das kann eigentlich nur der Mensch. In unserem speziellen Fall der Programmierer. Entsprechend muss auch der Programmierer auch hier erstmal umlernen und aufhören per Skill eine Internetseite oder eine herkömliche Sprachsuche bei google nachbauen zu wollen.
In der Summe wird es mit der Zeit immer bessere Skills geben und in 1 bis 3 Jahren werden wir herzlich darüber lachen wie merkwürdig das in 2017 doch noch war. Was man kann man tun um die Entwicklung zu pushen? Naja, selbst Hand anlegen und Skills programmieren. Eine erste Anlaufstelle sind dabei z.B auch Entwicklergruppen.
Schnappt euch irgendwelche Skills und probiert sie aus indem ihr „ganz normal“ mit Alexa sprecht, so wie man auch mit einem Menschen sprechen würde (Naja, vielleicht nicht mit dem Schwiegermutterdrachen…). Ihr werdet sehen, fast alle Skills werden zum größten Teil versagen. Trotz der aktuellen Entwicklungssituation ist es jedoch in keinster Weise zu verstehen wieso z.B Chefkoch einen so derart schlechten Skill, für eine eigentlich tolle Marke und tolle Inhalte in den Skillstore verklappt. Die Chefkochinhalte sind bei uns per App Dauergast in der Küche. Ihr könnt ja den Chefkoch-Skill mal nach einem Rezept für Spagetti Bolognese fragen. Ohje, ohje…. Wirklich nur um einer der Ersten in Skillshop zu sein? Doch soll damit garnicht Chefkoch an die Wand genagelt werden, sondern einfach die Bitte, bei der Entwicklung mehr an den Menschen zu denken und weniger ans Marketing. Das wird der Mensch danken und dann klappt es mit dem Marketing von ganz alleine. Wetten!?
Quelle: digitale-sprachassistenten
Schon von Haus aus hat Alexa ein paar interessante Funktionen die mehr oder minder gut funktionieren, auch wenn da natürlich noch wesentlich mehr geht. Um dieses mehr auch mehr werden zu lassen, lässt sich Alexa mit nachinstallierbaren Skills aufrüsten. Jedoch macht das aktuell kaum Spaß. Warum?
Du musst angemeldet sein, um Bilder zu sehen.
Icons made by Freepik
In erste Linie, ist es der normale Weg den ein neue Technologie zu gehen hat. Kennt noch jemand die ersten Apps fürs Smartphone? Genau! Die waren zum größten Teil auch erstmal ziemlich großer Schrott. Erst mit der Zeit ist die Technologie gereift und damit auch deren Entwickler und dessen Apps.
Alexa geht es hier nicht anders. Wobei es für die Entwickler jedoch neben den technologischen Grenzen noch ein gänzlich anderes/neues Problem gibt; das Verständnis der menschlichen Sprache! Nein, das liegt nicht daran das Programmierer irgendwelche Morloks in dunkeln, nassen und miefigen Kellern sind die sich von Pizza ernähren (Diese Zeiten sind im übrigen schon seit den 90ern vorbei). Es liegt daran das Ligusistik numal eine komplexe Wissenschaft ist und ein jeder Mensch, auch Entwickler… zwar sehr viel können und wissen, aber eben auch nicht alles. Auch Marc Zuckerberg oder Larry Page nicht (Nagut, die Ehefrau evtl. schon!).
Schaut man sich die Entwicklung vom Computer zum Smartphone an, so war dieser Schritt eigentlich in seinem Grundprinzip nicht wirklich groß. Beides hat Bildschirm, Tastaur und Maus/Touchpad. Dies ist bei Sprachassistenten schonmal gänzlich anders. Hier gilt „Voice First“ und damit gibt es dann als einziges Kommunikationsmittel eben nur die Sprache. Womit auch klar ist, das alleine über Sprache eben nicht alles mitgeteilt werden kann. Ein Bild oder eine Farbe kann man nur schwer versprachlichen. So hat auch Amazon selbst im Grunde noch zahlreiche Stolperfallen indem eine App zur Konfiguration von Alexa eingesetzt werden muss. Auch hier existiert entsprechend von Haus aus schon ein Medienbruch, weil eben nicht alles über Sprache konfigurierbar gemacht wurde.
Die Entwickler sind es gewohnt in Hierachien, Schlagworten, Klicks und Bildern zu entwicklen und zu denken. Dabei müssten sie eigentlich in Phrasen und in Kontexten denken. Ein jeder von uns hat sich bei einem Anruf schonmal durch einen Telefonassistenten „Bei Bla, drücken sie Blubb!“ durchkämpfen müssen. Mit menschlicher Sprache hat das Nichts zu tun. Genau so sehen fast alles derzeit erhältlichen Skills auch aus.
Die besser bewerteten Skills sind oft die Skills, die eigentlich nicht wirklich Sprache brauchen und in die Kategorie Smart Home gehören. Viel mehr als „An“, „Aus“ oder „zu 50%“ sind da kaum gefordert und eben auch nicht drinn. Logisch das diese Skills ausreichend gut funktionieren. Was wäre wenn ein solcher Skill auf die folgende Sache reagieren müsste? „Alexa, stell die Heizung bitte so ein, das mir nicht mehr kalt ist!“. hm!?
Menschliche Sprache ist auf viele Arten komplex. Die Maschine kann dies (noch) nicht wirklich einordnen und damit umgehen. Dazu kommen die technologischen Grenzen der digitalen Sprachassistenzsysteme selbst. Das kann eigentlich nur der Mensch. In unserem speziellen Fall der Programmierer. Entsprechend muss auch der Programmierer auch hier erstmal umlernen und aufhören per Skill eine Internetseite oder eine herkömliche Sprachsuche bei google nachbauen zu wollen.
In der Summe wird es mit der Zeit immer bessere Skills geben und in 1 bis 3 Jahren werden wir herzlich darüber lachen wie merkwürdig das in 2017 doch noch war. Was man kann man tun um die Entwicklung zu pushen? Naja, selbst Hand anlegen und Skills programmieren. Eine erste Anlaufstelle sind dabei z.B auch Entwicklergruppen.
Schnappt euch irgendwelche Skills und probiert sie aus indem ihr „ganz normal“ mit Alexa sprecht, so wie man auch mit einem Menschen sprechen würde (Naja, vielleicht nicht mit dem Schwiegermutterdrachen…). Ihr werdet sehen, fast alle Skills werden zum größten Teil versagen. Trotz der aktuellen Entwicklungssituation ist es jedoch in keinster Weise zu verstehen wieso z.B Chefkoch einen so derart schlechten Skill, für eine eigentlich tolle Marke und tolle Inhalte in den Skillstore verklappt. Die Chefkochinhalte sind bei uns per App Dauergast in der Küche. Ihr könnt ja den Chefkoch-Skill mal nach einem Rezept für Spagetti Bolognese fragen. Ohje, ohje…. Wirklich nur um einer der Ersten in Skillshop zu sein? Doch soll damit garnicht Chefkoch an die Wand genagelt werden, sondern einfach die Bitte, bei der Entwicklung mehr an den Menschen zu denken und weniger ans Marketing. Das wird der Mensch danken und dann klappt es mit dem Marketing von ganz alleine. Wetten!?
Quelle: digitale-sprachassistenten