Konferencje
Mobile Trends

Okulary translacyjne Google Glass – potencjał wykorzystania technologii AR w życiu codziennym

Na Google I/O, corocznej konferencji organizowanej przez Alphabet Inc, przedstawiono nowy koncept okularów rozszerzonej rzeczywistości. Urządzenie ma jeszcze mocniej zintegrować dotychczasowy ekosystem narzędzi Alphabetu poprzez zastosowanie tłumacza w praktyce. Gogle od Google, z wykorzystaniem translatora Google mogą wyświetlać mówiony tekst w czasie rzeczywistym osobie, które jest w trakcie ich noszenia. No właśnie, mogą? 

W środę i czwartek (11 i 12 maja) miała miejsce konferencja dla programistów Google I/O. Rozpoczęła się dość pozytywnym dla nas akcentem, gdyż Sundar Pichai, znany też jako figura CEO korporacji Alphabet, wyraził podziw dla pomocy, jaką Polacy odznaczają się w odniesieniu do uchodźców wojennych z Ukrainy. 

Następnie dowiedzieliśmy się więcej o Google Pixel 6a, czyli nowym średniaku z 6,1-calowym ekranem, odświeżanym zegarem 60 Hz, z pojemnością 6 GB RAM oraz baterią o pojemności 4306 mAh. Aparat 12 Mpix i Wi-Fi 6E w komplecie za niecałe 1 920 złotych brzmią dość przyzwoicie. Dla niepocieszonych ofertą zapowiedziano także premierę modeli Pixel 7 i Pixel 7 Pro, z Androidem 13 na pokładzie. Poza tym zobaczymy także smart zegarek i tableta oraz słuchawki TWS z rodziny Pixelowej.

Pracowite Google

Wszyscy wiemy jak Google ciężko pracuje nad swoimi produktami. Projekt Starline mający zapewnić doznanie jak ze spotkania na żywo, ciągłe zmiany w algorytmach, ostatni rozwój wyszukiwarki czy dostosowywanie się pod obowiązujące nowe restrykcje prawne to nadal niektóre z wielu ich projektów. 

AR to niewypał?

Niestety te bardziej rewolucyjne to nadal tylko prototypy, do których zaliczyć możemy też i Google Glass. 

Zestaw słuchawkowy zaczął swoją egzystencję dekadę temu – od ogłoszenia prac nad prototypem w 2012 roku, do ograniczonej sprzedaży w 2013 roku, po rok 2014, w którym to  w maju, stały się wówczas publicznie dostępnym produktem sprzedawanym pod nazwą Glass Explorers. 

Posiadały wbudowany aparat fotograficzny o rozdzielczości 5 Mpix i kamerkę 720p Magazyn Forbes wyraził obawę szkodliwości urządzenia, które daje noszącemu je możliwość szybkiej i łatwej kradzieży danych osobowych oraz nagrywania bez czyjejś zgody. Niektóre amerykańskie kina podobno zakazały wstępu z zestawem słuchawkowym na sobie, a firmy wyraziły obawę o nadużycie technologii. 

Projekt nie miał też dobrze sprofilowanej bazy odbiorców docelowych i był dość nieestetyczny i miałki w użyteczności, toteż szybko zmalało zainteresowanie oraz popyt na jego kupno.Twórcy zaniedbali nie określili odbiorców swojego produktu, co nie pozwoliło im sprofilować konkretnych potrzeb, jakie ten mógł spełniać. Podobnie było z innym zestawem AR, tym od Snapchata. Konstruktorzy czwartej już generacji Snap Spectacles wyciągnęli cenne lekcje z nieudanych sprzedażowo projektów, co chyba poczynił również Google definiując nową funkcjonalność na pokazie podczas Google I/O.

Gogle od Google – a jednak wizja przyszłości?

Poza ogłoszeniem nowego systemu, bogatszego w nowe funkcjonalności portfela czy Emergency SOS, firma postanowiła pochwalić się wzmożoną pracą nad bezpieczeństwem i implementację obowiązkowego uwierzytelniania dwuskładnikowego. 

Co więcej, Google postanowiło wytyczyć nowy szlak w szeregu augmented reality i połączyć funkcjonalności własnego ekosystemu w jednym urządzeniu. Na razie przedstawił kuszącą wizję okularów, które miałyby tłumaczyć usłyszaną mowę w czasie rzeczywistym, pokazując użytkownikowi tekst pochodzący z tłumacza na ekranie przed sobą. Opcja ta znacznie ułatwiłaby komunikację między przedstawicielami różnych kultur i narodowości, ale pomogłaby też ludziom niesłyszącym lub z wadami słuchu, którzy nie mogą z jakichś powodów nosić aparatów słuchowych. 

Film, który zobaczyliśmy, przedstawia wizualizację, nie rzeczywisty produkt. Na razie jedyne co zadzieję się w kwestii około okularowych to fakt, że do Tłumacza ma trafić ponad dwadzieścia nowych języków, a nauczanie maszynowe ma poprawić możliwości translatorskie narzędzia.

To nie takie takie łatwe!

To co zobaczyliśmy w Mountain View, nie było żadną rewolucją, a jedynie jej wizją. Przejęcie przez Alphabet firmy North zajmującej się produkcją inteligentnych okularów dobrze rokuje na przyszłość, ale nadal są pewne nierozwiązane problemy, które stoją na drodze do jakiejkolwiek użyteczności.

Pierwszą z barier jest otoczenie, które stanowi przecież tło dla wyświetlacza, co oznacza, że dla tekstu również. Ciężko skupić się nieraz przy zwierzęciu obok laptopa czy dziecku biegającym po pomieszczeniu, a zestaw ma pokazywać tekst na środowisku, które jest w ciągłym ruchu. Inną kwestią pozostaje samo światło, którego nawet najmniejsza ilość często poważnie utrudnia czytanie z ekranu, więc co w sytuacji gdy pada bezpośrednio na wyświetlany tekst?

W The Verge twierdzą, że to akurat nie jest najcięższym rozwiązaniem i prawdopodobnie Google jakoś z tego wybrnie. Pozostaje zatem kwestia samego narzędzia tłumaczącego, czyli Tłumacza Google, który zawiaduje ogromną ilością języków i co się z tym wiąże słów w nie wchodzących. 

Posiada on bogatą bazę, którą potrafi tłumaczyć, ale tylko na linii słowo-słowo. Wszyscy wiemy, że czyni to raczej w dość prostej formie, nie radząc sobie z kontekstem znaczeniowym danego wyrażenia. 

Wszak możemy wyobrazić sobie jak jesteśmy w obcym kraju i prosimy kogoś o zamknięcie zamka na klucz, czy gdy mówimy, że boli nas staw. 

Na przestrzeni lat Google poprawiło się w tej kwestii i lepiej odczytuje konteksty, dla pewności podpowiadając inne frazy możliwych tłumaczeń, a także zaczęło tłumaczyć strony z coraz lepszymi efektami. 

Czasem zdarza się jednak, że tłumaczenie nie radzi sobie z tekstami większego skomplikowania i wypada dość blado w porównaniu do innych translatorów.

Pamiętajmy, że nadal mowa o tekście pisanym, czyli naturalnym środowisku dla algorytmów. Asystent Google często ma problem ze zrozumieniem akcentów czy poszczególnych wyrażeń językowych, co wymaga korzystania z niego w formie jak najprostszych poleceń. Zważywszy na fakt, że technologie Google łączą się ze sobą, a Asystent i Tłumacz korzystają z uczenia maszynowego to możemy się tym martwić. Niektórzy ludzie mogą przecież w rozmowie używać wielu przerywników, zapożyczeń, błędów logicznych czy nawet kilku języków naraz, wówczas narzędzia Google’a nie będą w stanie poradzić sobie z interpretacją takiego przekazu, z którym człowiek rozumiejący dany język czy jego odmianę nie miałby najmniejszego problemu. A przecież o to w tym wynalazku chodzi, żeby umożliwiał komunikację, a nie ją utrudniał!

Dobrze podsumowali to dziennikarze z The Verge: Tłumaczenie słów jest łatwe; ustalenie gramatyki jest trudne, lecz możliwe. Ale język i komunikacja są znacznie bardziej złożone niż tylko te dwie rzeczy, czytamy w artykule. 

Napisali też oni o błędach w prezentacji, które nie przystoją tak ogromnej korporacji, co wytknął im Rami Ismail, współtwórca Vlambeer. Pogratulował Google napisanie skryptów arabskich do góry nogami i wyraził współczucie, że “mały, niezależny startup” nie jest w stanie zapłacić dodatkowej osobie posługującej się językiem arabskim na poziomie czterolatka.  

Mimo wszystko, zapewne nikomu nie chodzi o to, żeby dokuczać Alphabetowi. Fani technologii i trendsetterzy ze świecącymi oczyma śledzą aktualizacje dotyczące nowości od Google i dostrzegają wyzwania oraz drobne błędy, których można było uniknąć prostym i tanim kosztem, czyli większą uważnością. Mimo wszystko czuć entuzjazm w gronie tech, ale też w samym Google, które ewidentnie bardzo mocno pracuje na swoje miejsce na tronie w rozszerzonej rzeczywistości.

Udostępnij
Zobacz także