Spotify otrzymał patent na technologię, która ma na celu interpretację mowy użytkowników i hałasu w otoczeniu. Oprogramowanie ma lepiej dopasować muzykę, której słuchają jego odbiorcy. W lutym 2018 roku portal streamingowy złożył wniosek patentowy, a w styczniu 2021 roku go otrzymał. Chodzi o rozpoznawanie mowy w celu określenia stanu emocjonalnego użytkowników, ich płci, wieku oraz akcentu. Spotify zasugerował, że dzięki temu systemowi może promować spersonalizowane czy też przypuszczalne treści reklamowe audio, ale także muzykę czy podcasty do użytkowników na podstawie wykrytych w nich cech osobowości.
Nowa technologia Spotify
Według wniosku patentowego, firma opracowuje technologię, która może wyodrębnić intonację głosu, stres, rytm oraz inne jednostki mowy, które pozwoliłyby na wykrycie i skategoryzowanie stanu emocjonalnego użytkownika. Spotify wykazało, że zmienne behawioralne takie, jak nastrój użytkownika z korelacją takich danych jak ulubiony gatunek muzyki oraz informacje demograficzne mogą odpowiadać różnym cechom osobowości użytkownika. Zgodnie ze szczegółami opublikowanymi w nowym amerykańskim patencie Spotify, firma chce wykorzystać technologię, aby “jeszcze bardziej zagłębiać się w głowach odbiorców”. Nowy patent obejmuje metodę przetwarzania dostarczonego sygnału audio, który zawiera treść mowy i szum otoczenia, tła. Spotify wskazuje, że jest też w stanie oszacować wiek odbiorcy na podstawie kombinacji długości ścieżki głosowej i wysokości tonu. Następnie takie komponenty są poddane analizie. Korporacja wyjaśnia, że aplikacja do strumieniowego przesyłania multimediów zawiera funkcje zapewniające użytkownikowi spersonalizowane zalecenia dotyczące multimediów. Ponadto system może być użyty do wyodrębniania informacji związanych z płcią oraz z sygnałem mowy i przedstawienia ich za pomocą zestawu wektorów zwanych cechą. Funkcje takie jak gęstość widma mocy lub częstotliwości przy maksymalnej mocy mogą dostarczyć streamingowi informacji o naszych głośnikach.
Obecna personalizacja treści w Spotify
Obecnie dostosowanie treści oferowanych przez Spotify odbywa się poprzez dane demograficzne, które użytkownik podaje przy rejestracji. Po stworzeniu konta na platformie dostawca prosi o podanie dodatkowych informacji w celu zawężenia oferty programowej – przykładowo wybranie kilku artystów, którzy wpasowują się w gust muzyczny. Według platformy dane te nie są wydajne, ponieważ nanie wymaga to od użytkownika żmudnego wprowadzania odpowiedzi na wiele pytań, by system mógł zidentyfikować nawyki muzyczne słuchacza.
Spotify właścicielem patentów
Patent na technologię określającą stan emocjonalny to najnowszy z serii patentów przyznanych Spotify w Stanach Zjednoczonych w ostatnich miesiącach. We wrześniu 2020 roku aplikacja muzyczna uzyskała patent na nową funkcję oferującą nakładanie utworów muzycznych na własne wokale. Dwa miesiące po przyznaniu tego patentu, firma uzyskała kolejny, który umożliwił firmie kierowanie reklam do odbiorców wykorzystując dźwięk 3D.
Wygodny patent nie dla użytkownika?
Rozwijająca się technologia sztucznej inteligencji wydaje się być użyteczna tylko dla dużych korporacji. Dobro człowieka pozostaje na marginesie. Technologia rozpoznawania twarzy w Chinach, teraz możliwość wykrywania emocji to mechanizmy służące interesom dużych holdingów. Czy one mogą być szkodliwe dla odbiorcy? Technologie te są bardzo inwazyjne, posiadające olbrzymi wpływ na nasze życie. Przykładowo banki po zalogowaniu do aplikacji, będą chciały zbadać nasze emocje. Po otrzymaniu takich danych i odpowiednim skorelowaniu będzie można wyciągać ogromne wnioski. Czy takie rzeczy są potrzebne w celu personalizacji oferty? Czy to faktycznie będzie bezpieczne? Wcześniej czy później zgromadzone dane mogą znaleźć się w niewłaściwych rękach, a algorytm może być użyty w niewłaściwy sposób. Szczególnie, że wykorzystanie takich mechanizmów może generować ogromne zyski.
AKTUALIZACJA [9.04.2021]
Organizacja działająca na rzecz praw człowieka Access Now wystosowała list do dyrektora generalnego Spotify Daniela Eka. Grupa non-profit zwróciła uwagę, że niedawno opatentowany algorytm rozpoznawania emocji, płci i wieku jest technologią, która narusza prywatność i inne prawa człowieka. Fundacja wskazuje na wątpliwość badań naukowych dotyczących rozpoznawania stanów emocjonalnych przez urządzenia elektryczne. Nawet jeśli algorytm działałby bez problemu, naraża on użytkowników na niebezpieczeństwo. Może prowadzić to w efekcie do manipulacji emocjami osoby w taki sposób, aby zachęcać ją do dalszego słuchania muzyki. W liście wskazane są również przesłanki dyskryminujące płeć. Patent może nie uwzględniać osób transseksualnych i osoby niebinarne. Autorzy listu wskazują, że jeśli kategoryzujemy ludzi ze względu na płeć to doprowadza to do pogłębiania się stereotypów płciowych i kreowania często zgubnych kanonów pojmowania męskości i kobiecości. Access Now wskazuje, że streaming muzyczny ma wystarczającą ilość danych swoich klientów w celu personalizacji treści, a algorytm rozpoznawania emocji jest zbędny i mało bezpieczny.
List jest dostępny tutaj.