Pierwsi asystenci głosowi pojawili się już 8 lat temu w postaci należącej do Apple technologii Siri. Obecnie wybór jest znacznie większy. Takie rozwiązania oferuje Amazon (Alexa), Microsoft (Cortana), Google (Now) i Samsung (Bixby). Przełomem było wdrożenie przez Google (Home) i Amazon (Echo) inteligentnych głośników umożliwiających m.in. zarządzanie domem (np. temperatura, oświetlenie) i sprzętami domowymi – coraz więcej wytwórców takich urządzeń wyposaża je w taką funkcję komunikacji. Wprowadzona na rynek w 2014 roku Alexa Echo musi być podłączona do prądu i internetu poprzez wi-fi. Urządzenie w funkcji standby słucha ludzkiej mowy i jest aktywowane przez defaultowe hasło Alexa, następnie może zostać poproszone o udzielenie informacji pogodowych, newsów w różnych kategoriach, na komendę dzwoni pod predefiniowane numery telefoniczne, zarządza urządzeniami domowymi w ramach funkcji „inteligentny dom”. Na dźwięk głosu są dostępne właściwie wszystkie możliwości, które do tej pory realizowane były przez aplikacje na komputerze, smartfonie czy tablecie. Komunikacja ma oczywiście charakter dwustronny.

Większość użytkowników (aż 81 proc.) korzysta z asysty głosowej poprzez smartfony i 71 proc. twierdzi, że ta forma kontaktu jest satysfakcjonująca, szczególnie do realizacji rutynowych, codziennych zadań. Główną przyczyną zachęcającą do korzystania z usług głosowych jest wygoda – ludzie wypowiadają 125-175 słów na minutę, a średnia liczba słów wprowadzonych poprzez klawiaturę to mniej niż 40. Dlatego 82 proc. konsumentów podaje, że to właśnie szybkość jest kluczowym czynnikiem zachęcającym do korzystania z głosowej technologii.

Alexa Echo zdominowała rynek amerykański – ponad 70 proc. sprzedanych głośników (tzw. smart speakers) to sprzęt właśnie tej marki. Juniper Research prognozuje, że do 2022 roku co drugie gospodarstwo domowe w USA będzie posiadało takie urządzenie – dziś z takiej możliwości korzysta 17 mln Amerykanów. Z kolei według firmy konsultingowej Capgemini w ciągu 3-4 lat 40 proc. konsumentów w USA i Europie Zachodniej będzie bardziej skłonnych korzystać z opartych o sztuczną inteligencję asystentów głosowych niż ze strony internetowej lub aplikacji, a 31 proc. wybierze urządzenia głosowe, rezygnując z odwiedzenia sklepu lub oddziału firmy. To może zrewolucjonizować filozofię dotychczasowych interakcji firm z konsumentami, zwiększając ich lojalność wobec podmiotów, które najlepiej opanują sztukę zarządzania głosem budując, w całym tego słowa znaczeniu, dialog z klientami. Głos klienta i wypowiadane przez niego treści staną się nowym źródłem informacji umożliwiającym lepsze zaspokojenie jego potrzeb i przewidywanie, w jakim kierunku będą one się zmieniać.

Kluczem będzie zidentyfikowanie wzorców językowych użytkowników i zachowań, z którymi można je powiązać. Zmiany obejmą też działalność reklamową, nie będzie bowiem wizualnego interfejsu, na którym reklamy mogłyby się pojawiać.

Ciekawie wygląda struktura użytkowników urządzeń oferujących tego typu możliwości. Wcale nie są to najmłodsi konsumenci. Dominują osoby w wieku 32-45 lat (28 proc.), a tych w przedziale 22-32 lat jest tyle samo, co w widełkach 46-60 lat (tj. 24 proc.). Jako najczęstszy cel korzystania z asystentów głosowych wymieniają oni:

• sprawdzanie informacji, ofert, przepisów kulinarnych i umawianie spotkań (aż 82 proc) ,

• uzyskanie dostępu do streamingu muzyki i video,

• uzyskanie dostępu do serwisu wsparcia klienta różnych firm i marek,

• ponad jedna trzecia użytkowników zamówiła tą drogą towary lub jedzenie,

• 31 proc. zarządzało urządzeniami domowymi,

• a jedna czwarta zleciła dokonanie płatności.

Szczególnie szerokie pole otwiera się właśnie przed zastosowaniem głosu do realizacji usług finansowych. Zyskało to już nawet swoją nazwę – bankowość konwersacyjna. Capgemini wskazuje, że 28 proc. osób korzystających z głosowych asystentów dokonało tą drogą płatności lub przelewu. Dane BI Intelligence wskazują natomiast, że płatności za pomocą głosowych asystentów dokonało już 18 mln Amerykanów, a dynamika wzrostu wynosi ponad 30 proc. rocznie. Oznacza to że jedna trzecia – 80 mln dorosłych obywateli USA używać będzie technologii głosowej w sferze finansowej w roku 2022. Głównymi operatorami płatności są Amazon oraz Google, a PayPal, Venmo i Square Cash oferują głosowe płatności poprzez Siri. Firmy te chcą być liderami na tym szybko rosnącym rynku. Duże banki, jak Bank of America, Capital One czy USSA, udostępniają też interfejsy umożliwiające tego rodzaju płatności. Poza USA rozwiązaniami takimi dysponują m.in. brytyjski challenger bank Monzo, niemiecki N26 czy Royal Bank of Canada. W Polsce technologia głosowa w bankach na razie występuje głównie jako element uwierzytelnienia klienta w trakcie logowania.

Płatności realizowane głosem są na razie raczej traktowane przez klientów jako eksperyment - dotyczą przede wszystkim małych sum związanych ze sferą e-commerce – np. zakupów środków czystości, książek, muzyki lub biletów na różne wydarzenia. Głównym powodem, który powstrzymuje potencjalnych klientów od korzystania z usług cyfrowych pomocników, są zastrzeżenia związane z bezpieczeństwem – takie obawy wyraża 65 proc. osób, które nie korzystały do tej pory w ogóle z technologii głosowej. Większość, która to robi (69 proc.) używa technologii w zaciszu domowym, a jedynie 32 proc. jest skłonnych robić to w miejscach publicznych. Czynnikiem powstrzymującym ludzi od wydawania poleceń urządzeniom w takiej przestrzeni wydaje się być swoista nieśmiałość. Komfort i bezpieczeństwo mogą zostać podniesione poprzez dodanie do nich wizualnych interfejsów, dzięki którym klienci będą mogli widzieć dane dokonywanej transakcji i potwierdzić ją…. także głosem. To może zachęcić do procesowania bardziej złożonych usług jak różnego rodzaju przelewy, pożyczki i lokowanie środków, nie mówiąc już o doradztwie finansowym, czy inwestycyjnym.

