Maszyny z wyobraźnią
Sztuczna inteligencja, doskonała w wykrywaniu podobieństw cierpi na pewne ograniczenia - brakuje jej wyobraźni, potrzebnej do samodzielnego tworzenia. Oznacza to, że takie algorytmy z łatwością wyodrębniają obrazy, na których np. znajduje się rowerzysta, jednak same nie potrafią takiego obrazu stworzyć. Ma się to zmienić za sprawą pewnego odkrycia, które miało miejsce na Uniwersytecie w Montrealu. Stworzona przez Iana Goodfellow koncepcja, znana jako generative adversarial network sprawiła, że SI po raz pierwszy zyskała swoistą wyobraźnię. Jak do tego doszło?W dużym uproszeniu GAN polega na rywalizacji dwóch sieci neuronowych w grze przypominającej kotka i myszkę. Obie sieci uczą się na podstawie tej samej bazy danych. Jedna z nich przyjmuje rolę generatora i na podstawie widzianych wcześniej obrazów tworzy podobne. Druga, zwana dyskryminatorem, sprawdza, czy wygenerowany obraz jest wygenerowaną przez maszynę wadliwą kopią. W ten sposób maszyna odrzuci grafikę przykładowego rowerzysty posiadającego dodatkową kończynę lub oczy z tyłu głowy. Z czasem komputer uzbrojony w GAN staje się tak dobry w tworzeniu obrazów, jak algorytmy uczenia maszynowego w ich odróżnianiu. W testach okazało się, że technologia doskonale radzi sobie z naśladowaniem ludzkiej mowy, jak również z tworzeniem fotorealistycznych obrazów. Wygenerowane przez SI materiały charakteryzowały się takim realizmem, że odróżnienie sztucznie wygenerowanych próbek od prawdziwych przykładów było co najmniej problematyczne.
Rozumienie danych i głosu w trybie rzeczywistym
Wszyscy pamiętamy sceny z kultowych filmów science fiction, w których bohaterowie za sprawą ekstrawaganckiej technologii nie tylko rozumieli obce języki, lecz nawet z łatwością się w nich komunikowali. Rok 2018 przybliża nas do tej rzeczywistości, a wszystko za sprawą opracowywanych urządzeń do tłumaczenia języka mówionego w czasie rzeczywistym. Za pośrednictwem połączonej ze smartfonem słuchawki możliwe będzie natychmiastowe tłumaczenie sentencji wypowiadanych w innym języku przez rozmówcę na pożądany przez użytkownika. Pomimo kilku obaw o doskonałość tego rozwiązania, które zapewne sprawdzą się w pierwszej fazie jego rozwoju, to bardzo obiecująca technologia, bazująca na technice NLP (Natural Language Processing) czyli przetwarzaniu języka naturalnego.- To jedno z podstawowych narzędzi cognitive computingu, pozwalającego na badanie danych “ze zrozumieniem”. Dzięki temu, możliwe jest tłumaczenie tekstu w czasie rzeczywistym - także w formie głosowej, ale także przeszukiwanie ogromnych zbiorów firmowych danych w poszukiwaniu nie tyle danej frazy czy zdania, ale nawet konkretnego “kontekstu” ich zastosowania czy poddawanie analizie biznesowej całego cyfrowego dobytku przedsiębiorstwa, a nie jedynie jego skrawka. Techniki kognitywne potrafią “sięgać” także po nieustrukturyzowane dane, czyli te dotychczas niewykorzystywane przez firmy, pozwalając np. na lepsze poznanie klientów dzięki ich aktywności w sieci czy skuteczniejsze przewidywanie trendów bazując na większej liczbie parametrów z wielu źródeł. To bardzo istotna kwestia, biorąc pod uwagę, iż dzisiejszy biznes korzysta jedynie z 10-20% gromadzonych danych - dodaje Jacek Grzyb z firmy teamLeaders, firmy dostarczającej rozwiązania kognitywne.
Warto wspomnieć, że ostatnio, na uwadze zyskuje także technika rozumienia języka naturalnego (NLU - Natural Language Understanding), której rozwój pozwala narzędziom sztucznej inteligencji na „radzenie sobie” z nieprzewidywalnymi danymi wejściowymi, co w przypadku rozmowy odnosi się np. do kolokwializmów, skrótów myślowych czy przestawionych szyków zdań, które dotychczas wprawiały rozwiązania bazujące na SI w zakłopotanie. Przy zastosowaniu NLU, zrozumiałe będą komendy zawierające wspomniane elementy czy proste błędy, które system będzie w stanie ujednolicić i udzielić odpowiedzi nie wymagając korekty ze strony rozmówcy.