
Jeśli jesteś podobny do mnie, istnieje duża szansa, że również nie wiesz, jaka jest najnowsza terminologia używana w dziedzinie nauki o danych… przepraszam, sztuczna inteligencja… nie, mam na myśli naukę o danych. Nie, mam na myśli sztuczną inteligencję. Niech ktoś mi powie, jak mam to nazywać i jaka jest różnica!
Czy sztuczna inteligencja nie jest tylko nową, fajną nazwą na oznaczenie starej tradycyjnej nauki o danych? Czy obie koncepcje nie obejmują tych samych algorytmów? I czy to w ogóle nie jest uczenie maszynowe? Tak właśnie myślałem, dopóki nie zrobiłem przerwy, aby napisać ten post. Podczas tego oddechu cofnąłem się w czasie i próbowałem przypomnieć sobie wszystkie nazwy, które były używane do oznaczania tego obszaru, co zasadniczo jest analizą danych. Zobaczmy …
Nauczanie maszynowe
Na początku lat 90-tych rozpocząłem pracę nad pracą magisterską dotyczącą sieci neuronowych i algorytmów statystycznych. Algorytmy statystyczne w tym czasie dotyczyły głównie Naive Bayes. Sieci neuronowe oznaczały głównie algorytm wstecznej propagacji. C4.5 nie zostało jeszcze opublikowane.
A fajną nazwą było uczenie maszynowe.
Nacisk położono na „uczenie się” – algorytmy, które były w stanie samodzielnie nauczyć się, jak wykonać określone zadanie, tylko na podstawie zestawu danych. Cały entuzjazm dla nowej technologii polegał na tej funkcji samouczącej się, która ostro kontrastowała z poprzednimi systemami eksperckimi, w których reguły wiedzy były ręcznie tłumaczone na podstawie ludzkiej wiedzy. [i]
Eksploracja danych
Mniej więcej dekadę później eksploracja danych zaczęła oznaczać ten sam zestaw algorytmów uczenia maszynowego. W międzyczasie zaproponowano kilka nowych algorytmów samouczących się, na przykład całą rodzinę drzew decyzyjnych (ID3, C4.5, CART).
Eksploracja danych została zdefiniowana jako proces wykrywania wzorców w dużych zbiorach danych [ii], zwykle z wykorzystaniem algorytmów uczenia maszynowego. Następnie uwaga została przeniesiona z algorytmów i ich właściwości samouczących się na dane i wiedzę, które można z nich wydobyć.
Data Science
Kilka lat później, wraz z eksplozją dużych zbiorów danych i równoległych obliczeń, pojawił się termin data science. Zwróć uwagę, że definicja nauki o danych jest bardzo podobna do definicji eksploracji danych, ponieważ nadal wykorzystuje algorytmy uczenia maszynowego do wydobywania wiedzy z danych. [iii]
W międzyczasie tańsze i bardziej pojemne urządzenia pamięci masowej umożliwiły pracę z dużymi ilościami danych. W ten sposób duże zbiory danych – w ramach nauki o danych – wprowadziły znacznie większe zbiory danych i szybsze algorytmy uczenia maszynowego, które są w stanie zrównoleglać i przyspieszyć proces obliczeniowy. W szczególności Apache Spark oferuje szereg równoległych algorytmów uczenia maszynowego do analizy danych w swojej bibliotece MLlib.
Możemy więc powiedzieć, że „nauka” w nauce o danych odnosiła się do zdolności radzenia sobie z ogromnymi ilościami danych i z większą szybkością niż w poprzedniej dekadzie eksploracji danych.
Sztuczna inteligencja
Podanie definicji sztucznej inteligencji jest trudniejsze, ponieważ termin ten został właśnie wprowadzony, a jasna definicja nie została jeszcze opracowana [iv] [v] [vi].
Zobaczmy więc, co ostatnio zmieniło się w świecie analityki danych, aby uzasadnić potrzebę nowej nazwy: głębokie uczenie się. Uczenie głębokie reprezentuje współczesną ewolucję sieci neuronowych. Szybsze maszyny i znowu obliczenia równoległe utorowały drogę dla bardziej wyrafinowanych warstw neuronowych i bardziej złożonych architektur neuronowych. Przykładem są sieci zajmujące się przetwarzaniem obrazu, przetwarzaniem tekstu i, bardziej ogólnie, analizą szeregów czasowych.
Złożone przewidywania oparte na dawnych znakach, słowach lub obrazach to wielka innowacja architektur głębokiego uczenia. Szczególnie w połączonej dziedzinie przetwarzania tekstu i analizy szeregów czasowych stało się możliwych kilka nowych zadań, na przykład generowanie dowolnego tekstu [vii].
Uważam, że te nowe, bardziej kreatywne umiejętności – różniące się od tradycyjnej klasyfikacji czy automatyzacji powtarzalnych zadań – zasłużyły na określenie „inteligencja” w tej dziedzinie.
Podsumowując …
Nadal nie jestem pewien, czy warto co kilka lat zmieniać nazwę, aby opisać algorytmy uczenia maszynowego zastosowane do danych. Zaczynam jednak dostrzegać drobne zmiany w podejściu do tematu, które miały miejsce z biegiem czasu, a które spowodowały (potrzebę) nowej nazwy.
Przechodząc od samouczących się algorytmów do wyodrębniania wiedzy z danych, a następnie od rozszerzania algorytmów w celu szybszej pracy na większych zbiorach danych, aż do przejęcia bardziej twórczej roli dla najnowszej generacji modeli uczenia maszynowego, wydaje się, że te zmiany w centrum uwagi na przestrzeni lat wywołała potrzebę nowej nazwy dla tej samej starej dziedziny analityki danych.
Wróćmy teraz do naszej pracy, cokolwiek to może być: uczenie maszynowe, eksploracja danych, nauka o danych czy sztuczna inteligencja.
Dr Rosaria Silipo, główny analityk danych w KNIME, jest autorką ponad 50 publikacji technicznych, w tym jej najnowszej książki „Practicing Data Science: A Collection of Case Studies”. Posiada tytuł doktora z bioinżynierii i spędziła ponad 25 lat pracując nad projektami data science dla firm z wielu dziedzin, w tym IoT, wywiadu klienta, branży finansowej i cyberbezpieczeństwa. Śledź Rosarię na Twitterze, LinkedIn i blogu KNIME. Więcej informacji na temat KNIME można znaleźć na stronie www.knime.com.
[i] Bishop, CM, Sieci neuronowe do rozpoznawania wzorców, Springer, 1996
[ii] „Program nauczania eksploracji danych”. ACM SIGKDD, 2006-04-30, Źródło 2014-01-27
[iii] Dhar, V., „Nauka o danych i przewidywanie”, Komunikacja ACM. 56 (12): 64, 2013
[iv] „Sztuczna inteligencja”, definicja Wikipedii
[v] B. Marr, „Kluczowe definicje sztucznej inteligencji (AI), które wyjaśniają jej znaczenie”, Forbes, 2018
[vi] „Co to jest sztuczna inteligencja (AI)?” Definicja techopedii
[vii] K. Melcher, „Once upon a time… by LSTM Network”, blog KNIME, 2018