W ciągu dekady komputery będą odczytywać obrazy z mózgu

Autor: Tomasz Łysoń

14 czerwca 2021

Pamięć ejdetyczna to zdolność odtwarzania złożonych obrazów, dźwięków i innych obiektów z bardzo dużą precyzją i dokładnością. Osoby posiadające taką zdolność bez problemu mogą wyobrazić sobie wnętrza pomieszczeń w których przebywali chociażby przez chwilę oraz mają zdolność odtwarzania drogi, którą jechali jakiś czas temu. Obrazy ejdetyczne występują o wiele częściej u dzieci. Statystyki mówią, że zdolność tą posiada około 8% osób w wieku 7-12 lat i tylko 0,1% dorosłych. Naukowcy z Uniwersytetu w Kioto, wykorzystując sieci generatywne, stworzyli zaawansowany system sztucznej inteligencji. Narzędzie może odczytywać obrazy, które osoba “widzi” oczami wyobraźni i przekształcać je na zdjęcia cyfrowe z dokładnością do 99%.

Obecny stan i kierunek rozwoju

Sztuczna inteligencja już powstała, lecz jest jeszcze niezbyt dokładna. Obecnie algorytm odczytuje obrazy widziane oczyma wyobraźni, lecz wynik analizy ma wciąż niską rozdzielczość, a osoba musi znajdować się w urządzeniu do rezonansu magnetycznego. Wraz z rozwojem technologii i coraz to lepszym sprzętem do badań mózgu, komputery będą w stanie przekształcać nasze myśli w zdjęcia, które możemy zapisywać i udostępniać. Naukowcy z Uniwersytetu w Kioto przeprowadzili swoje eksperymenty już w 2018 roku. Pierwsza publikacja na temat systemu pojawiła się na łamach prestiżowego periodyku naukowego PLOS Computational Biology w 2019 roku. Już przed opublikowaniem artykułu naukowego, w 2018 roku pojawiły się pierwsze informacje na temat japońskiego systemu w Science Magazine, gdzie szczegółowo opisano działanie sztucznej inteligencji.

Naukowcy umieścili osoby poddane badaniu w skanerze fMRI, który przeprowadza specjalny rodzaj skanowania magnetycznego. Cylindryczna rurka skanera zawiera bardzo silny elektromagnes, który ma pole o natężeniu 3 tesli (T), czyli około 50 000 razy większe niż pole magnetyczne Ziemi. Pole magnetyczne wewnątrz maszyny wpływa na magnetyczne jądra atomów. W normalnych warunkach jądra atomowe są zorientowane losowo, lecz pod wpływem wytworzonego pola ustawiają się zgodnie z kierunkiem pola. Im silniejsze jest pole, tym występuje większy stopień wyrównania. Kluczem sukcesu takiego skanera jest to, że sygnał z jąder wodoru różni się siłą w zależności od otoczenia. Zapewnia to sposób rozróżniania istoty szarej, istoty białej i płynu mózgowo-rdzeniowego w obrazach strukturalnych mózgu. Na podstawie tego procesu badacze zarejestrowali aktywności w mózgu osób poddanych eksperymentowi.

W przeciwieństwie do tradycyjnego skanera MRI. fMRI umożliwia monitorowanie przepływu krwi w mózgu, tym samym pozwalając naukowcom określić, które obszary mózgu są najbardziej aktywne podczas wykonywania zadania. Podczas rejestracji sygnałów mózgowych z systemów wzrokowych badanych, uczeni pokazali im tysiące obrazków, wyświetlając każdy obraz kilka razy. Te działania wygenerowały ogromną bazę danych sygnałów mózgowych z każdym zestawem sygnałów odpowiadającym określonemu obrazowi. Kolejnym etapem było przekazanie informacji do głębokiej sieci neuronowej (DNN), którą przekształcono do tworzenia obrazów. Sieci neuronowe są bardzo dobrymi detektorami wzorców, a dla każdego zdjęcia pokazanego badanym, naukowcy podjęli próbę wygenerowania przez sieć neuronową obrazu pasującego do obserwowanych wzorców aktywności mózgu, poprawiając jego wynik ponad 200 razy. Efektem końcowym tych działań był system, który mógł pobierać dane fMRI pokazujące aktywność mózgu badanego i malować obraz w oparciu o to, co według niego widzi każdy badany. Następnie naukowcy dokonali zwrotu, bowiem przekazali dane DNN już przeszkolonej sieci generatywnej. Ten rodzaj połączeń jest stosunkowo nowy i stanowi jeden z najbardziej imponujących postępów sztucznej inteligencji, jakie nastąpiły w ciągu ostatniej dekady. Te wyspecjalizowane sieci neuronowe pobierają podstawowe informacje i generują zdjęcia i filmy, które nie odbiegają od tych, nagrywanych profesjonalną kamerą.

Sieci generatywne to technologia sprzyjająca deepfake. Umożliwia powstawanie sztucznych ludzi i filtrów wykorzystywanych m.in. w Snapchacie. W tym przypadku japońscy badacze wykorzystali sieć do normalizacji obrazków odczytanych z mózgów badanych i uczynienia ich bardziej realistycznymi. Ostatecznie sztuczna inteligencja pobrała informacje o aktywności mózgu, przekształciła je w prymitywne zdjęcia za pomocą DNN, po czym wykorzystano sieć generatywną do dopracowania tych obrazów. W celu przetestowania finalnie otrzymanych plików graficznych, powołano grupę „sędziów”, którym pokazano zbiór możliwych obrazów wyjściowych i poproszono o dopasowanie obrazów odczytanych z mózgu badanych do najbardziej podobnego obrazu wejściowego. W ponad 99% przypadków ludzie dopasowali obraz wygenerowany z mózgu, do tych, które wcześniej pokazywane były badanym.

Niewiarygodnym jest, że wykorzystując tylko sygnały mózgowe i sztuczną inteligencję, naukowcy z Uniwersytetu w Kioto byli w stanie zrekonstruować obrazy w mózgach badanych tak dobrze, że neutralni sędziowie mogli je dopasować do obrazków z „prawdziwego świata” prawie w stu procentach. Naukowcy po pierwszym sukcesie podnieśli poprzeczkę. Chciano uzyskać obraz, który osoby poddane eksperymentowi wyobrażali sobie w głowie. Do tych działań posłużyły informacje z pierwszej części badania, ponieważ wyobrażanie sobie ilustracji wykorzystuje podobne obszary w mózgu co oglądanie tych rzeczywistych. Rysunki powstałe wyłącznie z wyobraźni nie były tak dobre, jak te tworzone, gdy badani patrzyli na rzeczywiste zdjęcie. W momencie, gdy osoby poddane eksperymentowi zostały poproszone o wyobrażanie sobie prostych, kontrastowych kształtów (znak +, okrąg na pustym tle), a ich mózgi zostały zeskanowane, powstałe obrazy dopasowano do przykładów z rzeczywistego świata w 83,2%. W chwili obecnej ilustracje powstałe z sygnałów neuronowych są stosunkowo surowe. Badania pracowników Uniwersytetu w Kioto udowodniły, że można odczytywać obrazy z mózgów ludzi.

Wyższa rozdzielczość i lepsza jakość zapewniłaby dokładne spojrzenie w umysł i mózg badanej osoby i ułatwiłaby komputerowi zrekonstruowanie obrazów. Jeśli tak by się stało, wynalazek ten może zrewolucjonizować branżę artystyczną, a szeroko pojęte projektowanie uległoby przemianie. Wówczas aparaty fotograficznie byłyby bezużyteczne, bo każdy z nas mógłby zrobić zdjęcie umysłem. Wraz z rozwojem sztucznej inteligencji pogłębiają się dylematy moralne i kwestie związane z prawami człowieka. Niewątpliwie takie narzędzia mogłyby być obsługiwane przez nieodpowiednich ludzi do niewiadomych celów. Kwestie bezpieczeństwa i prywatności każdego z nas dzięki wynalazkowi mogą przestać istnieć, a wyciąganie informacji nigdy nie byłoby łatwiejsze.

Tweetnij

AI i dane w SEM: jak podejmować lepsze decyzje i zwiększać skuteczność kampanii

Każdy może dziś być strategiem. Dlaczego większość nim nie będzie?

Terminal płatniczy w telefonie a tradycyjny terminal – które rozwiązanie wybrać?

Szafy wydające – jak wybrać rozwiązanie, które usprawni logistykę w firmie?

Finanse potrzebują decyzji, nie kolejnych dashboardów – jak Amibudget ...

Finansowy agent AI – kiedy pieniądze zaczynają z nami rozmawiać

Jak wybrać platformę e-commerce bez kosztownych błędów i na co zwrócić uwagę w 2026 roku?

Jak Log Management przyspiesza wykrywanie problemów IT?

Finanse potrzebują decyzji, nie kolejnych dashboardów – jak Amibudget ...

15 lat innowacji! Poznaj laureatów jubileuszowej edycji Mobile Trends Awards 2025

Umarł GUI, niech żyje… doświadczenie bez interfejsu

UX bez perfekcjonizmu: dlaczego „odpuszczanie” jest dziś kluczową kompetencją projektanta

Jak systemy DAS rewolucjonizują łączność wewnątrzbudynkową?

Czy warto już dziś kupić telefon z 5G, jeśli mieszkasz w Katowicach?

Tablet do czytania – nowy wymiar cyfrowej lektury

Telefony komórkowe Infinix, Doogee czy OPPO – który smartfon będzie najlepszy dla Ciebie?

Cyfrowa rewolucja filantropii. Jak technologia zmienia crowdfunding i dobroczynność w Polsce?

Nowa era wyszukiwania: raport Altavia Kamikaze + K2 odsłania liderów AI Search w 40 kategoriach

Eleni Panagiotopoulou z SOFTSWISS wyróżniona tytułem Best AML Professional 2025

Jak stworzyć naprawdę ergonomiczne stanowisko pracy?

PIAP Connect – lokalne targi branży artykułów promocyjnych w nowej formule

Mobile Trends Conference 2026 – mniej hype’u, więcej świadomych decyzji

W ciągu dekady komputery będą odczytywać obrazy z mózgu

Obecny stan i kierunek rozwoju

AI i ludzie: czy transformacja zmieni pracowników, czy kompetencje?

Etyczna sztuczna inteligencja – czy to w ogóle możliwe?

Rewolucja GenAI w polskim biznesie. Jak sztuczna inteligencja zmienia firmy już dziś?

Korzyści z wdrożenia AI w biznesie: efektywność, decyzje i nowe źródła przychodów