10 przełomowych technologii 2018 r. według MIT

Maszyny z wyobraźnią

Sztuczna inteligencja, doskonała w wykrywaniu podobieństw cierpi na pewne ograniczenia - brakuje jej wyobraźni, potrzebnej do samodzielnego tworzenia. Oznacza to, że takie algorytmy z łatwością wyodrębniają obrazy, na których np. znajduje się rowerzysta, jednak same nie potrafią takiego obrazu stworzyć. Ma się to zmienić za sprawą pewnego odkrycia, które miało miejsce na Uniwersytecie w Montrealu. Stworzona przez Iana Goodfellow koncepcja, znana jako generative adversarial network sprawiła, że SI po raz pierwszy zyskała swoistą wyobraźnię. Jak do tego doszło?

W dużym uproszeniu GAN polega na rywalizacji dwóch sieci neuronowych w grze przypominającej kotka i myszkę. Obie sieci uczą się na podstawie tej samej bazy danych. Jedna z nich przyjmuje rolę generatora i na podstawie widzianych wcześniej obrazów tworzy podobne. Druga, zwana dyskryminatorem, sprawdza, czy wygenerowany obraz jest wygenerowaną przez maszynę wadliwą kopią. W ten sposób maszyna odrzuci grafikę przykładowego rowerzysty posiadającego dodatkową kończynę lub oczy z tyłu głowy. Z czasem komputer uzbrojony w GAN staje się tak dobry w tworzeniu obrazów, jak algorytmy uczenia maszynowego w ich odróżnianiu. W testach okazało się, że technologia doskonale radzi sobie z naśladowaniem ludzkiej mowy, jak również z tworzeniem fotorealistycznych obrazów. Wygenerowane przez SI materiały charakteryzowały się takim realizmem, że odróżnienie sztucznie wygenerowanych próbek od prawdziwych przykładów było co najmniej problematyczne.

Rozumienie danych i głosu w trybie rzeczywistym

Wszyscy pamiętamy sceny z kultowych filmów science fiction, w których bohaterowie za sprawą ekstrawaganckiej technologii nie tylko rozumieli obce języki, lecz nawet z łatwością się w nich komunikowali. Rok 2018 przybliża nas do tej rzeczywistości, a wszystko za sprawą opracowywanych urządzeń do tłumaczenia języka mówionego w czasie rzeczywistym. Za pośrednictwem połączonej ze smartfonem słuchawki możliwe będzie natychmiastowe tłumaczenie sentencji wypowiadanych w innym języku przez rozmówcę na pożądany przez użytkownika. Pomimo kilku obaw o doskonałość tego rozwiązania, które zapewne sprawdzą się w pierwszej fazie jego rozwoju, to bardzo obiecująca technologia, bazująca na technice NLP (Natural Language Processing) czyli przetwarzaniu języka naturalnego.

- To jedno z podstawowych narzędzi cognitive computingu, pozwalającego na badanie danych “ze zrozumieniem”. Dzięki temu, możliwe jest tłumaczenie tekstu w czasie rzeczywistym - także w formie głosowej, ale także przeszukiwanie ogromnych zbiorów firmowych danych w poszukiwaniu nie tyle danej frazy czy zdania, ale nawet konkretnego “kontekstu” ich zastosowania czy poddawanie analizie biznesowej całego cyfrowego dobytku przedsiębiorstwa, a nie jedynie jego skrawka. Techniki kognitywne potrafią “sięgać” także po nieustrukturyzowane dane, czyli te dotychczas niewykorzystywane przez firmy, pozwalając np. na lepsze poznanie klientów dzięki ich aktywności w sieci czy skuteczniejsze przewidywanie trendów bazując na większej liczbie parametrów z wielu źródeł. To bardzo istotna kwestia, biorąc pod uwagę, iż dzisiejszy biznes korzysta jedynie z 10-20% gromadzonych danych - dodaje Jacek Grzyb z firmy teamLeaders, firmy dostarczającej rozwiązania kognitywne.

Warto wspomnieć, że ostatnio, na uwadze zyskuje także technika rozumienia języka naturalnego (NLU - Natural Language Understanding), której rozwój pozwala narzędziom sztucznej inteligencji na „radzenie sobie” z nieprzewidywalnymi danymi wejściowymi, co w przypadku rozmowy odnosi się np. do kolokwializmów, skrótów myślowych czy przestawionych szyków zdań, które dotychczas wprawiały rozwiązania bazujące na SI w zakłopotanie. Przy zastosowaniu NLU, zrozumiałe będą komendy zawierające wspomniane elementy czy proste błędy, które system będzie w stanie ujednolicić i udzielić odpowiedzi nie wymagając korekty ze strony rozmówcy.