Co jest w imieniu? Sztuczna inteligencja czy nauka o danych?

 Co jest w imieniu?  Sztuczna inteligencja czy nauka o danych?

Je┼Ťli jeste┼Ť podobny do mnie, istnieje du┼╝a szansa, ┼╝e ÔÇőÔÇőr├│wnie┼╝ nie wiesz, jaka jest najnowsza terminologia u┼╝ywana w dziedzinie nauki o danychÔÇŽ przepraszam, sztuczna inteligencjaÔÇŽ nie, mam na my┼Ťli nauk─Ö o danych. Nie, mam na my┼Ťli sztuczn─ů inteligencj─Ö. Niech kto┼Ť mi powie, jak mam to nazywa─ç i jaka jest r├│┼╝nica!

Czy sztuczna inteligencja nie jest tylko now─ů, fajn─ů nazw─ů na oznaczenie starej tradycyjnej nauki o danych? Czy obie koncepcje nie obejmuj─ů tych samych algorytm├│w? I czy to w og├│le nie jest uczenie maszynowe? Tak w┼éa┼Ťnie my┼Ťla┼éem, dop├│ki nie zrobi┼éem przerwy, aby napisa─ç ten post. Podczas tego oddechu cofn─ů┼éem si─Ö w czasie i pr├│bowa┼éem przypomnie─ç sobie wszystkie nazwy, kt├│re by┼éy u┼╝ywane do oznaczania tego obszaru, co zasadniczo jest analiz─ů danych. Zobaczmy ÔÇŽ

Nauczanie maszynowe

Na pocz─ůtku lat 90-tych rozpocz─ů┼éem prac─Ö nad prac─ů magistersk─ů dotycz─ůc─ů sieci neuronowych i algorytm├│w statystycznych. Algorytmy statystyczne w tym czasie dotyczy┼éy g┼é├│wnie Naive Bayes. Sieci neuronowe oznacza┼éy g┼é├│wnie algorytm wstecznej propagacji. C4.5 nie zosta┼éo jeszcze opublikowane.

A fajn─ů nazw─ů by┼éo uczenie maszynowe.

Nacisk po┼éo┼╝ono na ÔÇ×uczenie si─ÖÔÇŁ – algorytmy, kt├│re by┼éy w stanie samodzielnie nauczy─ç si─Ö, jak wykona─ç okre┼Ťlone zadanie, tylko na podstawie zestawu danych. Ca┼éy entuzjazm dla nowej technologii polega┼é na tej funkcji samoucz─ůcej si─Ö, kt├│ra ostro kontrastowa┼éa z poprzednimi systemami eksperckimi, w kt├│rych regu┼éy wiedzy by┼éy r─Öcznie t┼éumaczone na podstawie ludzkiej wiedzy. [i]

Eksploracja danych

Mniej wi─Öcej dekad─Ö p├│┼║niej eksploracja danych zacz─Ö┼éa oznacza─ç ten sam zestaw algorytm├│w uczenia maszynowego. W mi─Ödzyczasie zaproponowano kilka nowych algorytm├│w samoucz─ůcych si─Ö, na przyk┼éad ca┼é─ů rodzin─Ö drzew decyzyjnych (ID3, C4.5, CART).

Eksploracja danych zosta┼éa zdefiniowana jako proces wykrywania wzorc├│w w du┼╝ych zbiorach danych [ii], zwykle z wykorzystaniem algorytm├│w uczenia maszynowego. Nast─Öpnie uwaga zosta┼éa przeniesiona z algorytm├│w i ich w┼éa┼Ťciwo┼Ťci samoucz─ůcych si─Ö na dane i wiedz─Ö, kt├│re mo┼╝na z nich wydoby─ç.

Data Science

Kilka lat p├│┼║niej, wraz z eksplozj─ů du┼╝ych zbior├│w danych i r├│wnoleg┼éych oblicze┼ä, pojawi┼é si─Ö termin data science. Zwr├│─ç uwag─Ö, ┼╝e definicja nauki o danych jest bardzo podobna do definicji eksploracji danych, poniewa┼╝ nadal wykorzystuje algorytmy uczenia maszynowego do wydobywania wiedzy z danych. [iii]

W mi─Ödzyczasie ta┼äsze i bardziej pojemne urz─ůdzenia pami─Öci masowej umo┼╝liwi┼éy prac─Ö z du┼╝ymi ilo┼Ťciami danych. W ten spos├│b du┼╝e zbiory danych – w ramach nauki o danych – wprowadzi┼éy znacznie wi─Öksze zbiory danych i szybsze algorytmy uczenia maszynowego, kt├│re s─ů w stanie zr├│wnolegla─ç i przyspieszy─ç proces obliczeniowy. W szczeg├│lno┼Ťci Apache Spark oferuje szereg r├│wnoleg┼éych algorytm├│w uczenia maszynowego do analizy danych w swojej bibliotece MLlib.

Mo┼╝emy wi─Öc powiedzie─ç, ┼╝e ÔÇ×naukaÔÇŁ w nauce o danych odnosi┼éa si─Ö do zdolno┼Ťci radzenia sobie z ogromnymi ilo┼Ťciami danych i z wi─Öksz─ů szybko┼Ťci─ů ni┼╝ w poprzedniej dekadzie eksploracji danych.

Sztuczna inteligencja

Podanie definicji sztucznej inteligencji jest trudniejsze, poniewa┼╝ termin ten zosta┼é w┼éa┼Ťnie wprowadzony, a jasna definicja nie zosta┼éa jeszcze opracowana [iv] [v] [vi].

Zobaczmy wi─Öc, co ostatnio zmieni┼éo si─Ö w ┼Ťwiecie analityki danych, aby uzasadni─ç potrzeb─Ö nowej nazwy: g┼é─Öbokie uczenie si─Ö. Uczenie g┼é─Öbokie reprezentuje wsp├│┼éczesn─ů ewolucj─Ö sieci neuronowych. Szybsze maszyny i znowu obliczenia r├│wnoleg┼ée utorowa┼éy drog─Ö dla bardziej wyrafinowanych warstw neuronowych i bardziej z┼éo┼╝onych architektur neuronowych. Przyk┼éadem s─ů sieci zajmuj─ůce si─Ö przetwarzaniem obrazu, przetwarzaniem tekstu i, bardziej og├│lnie, analiz─ů szereg├│w czasowych.

Z┼éo┼╝one przewidywania oparte na dawnych znakach, s┼éowach lub obrazach to wielka innowacja architektur g┼é─Öbokiego uczenia. Szczeg├│lnie w po┼é─ůczonej dziedzinie przetwarzania tekstu i analizy szereg├│w czasowych sta┼éo si─Ö mo┼╝liwych kilka nowych zada┼ä, na przyk┼éad generowanie dowolnego tekstu [vii].

Uwa┼╝am, ┼╝e te nowe, bardziej kreatywne umiej─Ötno┼Ťci – r├│┼╝ni─ůce si─Ö od tradycyjnej klasyfikacji czy automatyzacji powtarzalnych zada┼ä – zas┼éu┼╝y┼éy na okre┼Ťlenie ÔÇ×inteligencjaÔÇŁ w tej dziedzinie.

Podsumowuj─ůc ÔÇŽ

Nadal nie jestem pewien, czy warto co kilka lat zmienia─ç nazw─Ö, aby opisa─ç algorytmy uczenia maszynowego zastosowane do danych. Zaczynam jednak dostrzega─ç drobne zmiany w podej┼Ťciu do tematu, kt├│re mia┼éy miejsce z biegiem czasu, a kt├│re spowodowa┼éy (potrzeb─Ö) nowej nazwy.

Przechodz─ůc od samoucz─ůcych si─Ö algorytm├│w do wyodr─Öbniania wiedzy z danych, a nast─Öpnie od rozszerzania algorytm├│w w celu szybszej pracy na wi─Ökszych zbiorach danych, a┼╝ do przej─Öcia bardziej tw├│rczej roli dla najnowszej generacji modeli uczenia maszynowego, wydaje si─Ö, ┼╝e te zmiany w centrum uwagi na przestrzeni lat wywo┼éa┼éa potrzeb─Ö nowej nazwy dla tej samej starej dziedziny analityki danych.

Wr├│─çmy teraz do naszej pracy, cokolwiek to mo┼╝e by─ç: uczenie maszynowe, eksploracja danych, nauka o danych czy sztuczna inteligencja.

Dr Rosaria Silipo, g┼é├│wny analityk danych w KNIME, jest autork─ů ponad 50 publikacji technicznych, w tym jej najnowszej ksi─ů┼╝ki ÔÇ×Practicing Data Science: A Collection of Case StudiesÔÇŁ. Posiada tytu┼é doktora z bioin┼╝ynierii i sp─Ödzi┼éa ponad 25 lat pracuj─ůc nad projektami data science dla firm z wielu dziedzin, w tym IoT, wywiadu klienta, bran┼╝y finansowej i cyberbezpiecze┼ästwa. ┼Üled┼║ Rosari─Ö na Twitterze, LinkedIn i blogu KNIME. Wi─Öcej informacji na temat KNIME mo┼╝na znale┼║─ç na stronie www.knime.com.

[i] Bishop, CM, Sieci neuronowe do rozpoznawania wzorc├│w, Springer, 1996

[ii] ÔÇ×Program nauczania eksploracji danychÔÇŁ. ACM SIGKDD, 2006-04-30, ┼╣r├│d┼éo 2014-01-27

[iii] Dhar, V., ÔÇ×Nauka o danych i przewidywanieÔÇŁ, Komunikacja ACM. 56 (12): 64, 2013

[iv] ÔÇ×Sztuczna inteligencjaÔÇŁ, definicja Wikipedii

[v] B. Marr, ÔÇ×Kluczowe definicje sztucznej inteligencji (AI), kt├│re wyja┼Ťniaj─ů jej znaczenieÔÇŁ, Forbes, 2018

[vi] ÔÇ×Co to jest sztuczna inteligencja (AI)?ÔÇŁ Definicja techopedii

[vii] K. Melcher, ÔÇ×Once upon a timeÔÇŽ by LSTM NetworkÔÇŁ, blog KNIME, 2018