Stare gry Atari rewolucjonizują sztuczną inteligencję

Obserwując rozwój sztucznej inteligencji można odnieść wrażenie, że postęp dokonuje się głównie za Oceanem. Nic bardziej mylnego – pracują nad nim także inżynierowie z naszego kraju. Polska firma deepsense.ai we współpracy z Intelem przeprowadziła eksperyment, którego efekty mogą przysłużyć się rozwojowi robotyki i autonomicznych systemów wspomagających człowieka na różnych polach. Z pomocą przyszły kultowe gry Atari, na których naukowcy testowali nauczanie sieci neuronowych metodą nagród i kar.


 

Bazując na eksperymencie przeprowadzonym w 2013 roku przez DeepMind* Polacy postanowili stworzyć sieć neuronową, która sama nauczy się grać w proste gry –  kultowe tytuły Atari*, takie jak Breakout*, River Raid* czy Space Invaders*. Cel? Sprawdzić, czy sztuczna inteligencja pracująca na procesorach Intela, ucząc się samodzielnie rozgrywania gier wideo, zdoła na tej samej zasadzie nauczyć się kierowania prawdziwymi robotami czy autonomicznymi pojazdami – pomagając ludziom w rozwiązaniu wielu problemów.

 

W deepsense.ai pracujemy nad podobnymi zagadnieniami, więc postanowiliśmy powtórzyć eksperyment DeepMind nieco go modyfikując. W naszym badaniu wykorzystaliśmy niekonwencjonalną infrastrukturę, opierając się na procesorach Xeon Intela – wyjaśnia kierujący tym projektem w deepsense.ai dr hab. Henryk Michalewski z wydziału Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego.

 

Początkowo algorytm nie ma pojęcia na czym polega gra i sam musi dojść do tego, jak grać aby wygrywać. Kluczowy jest system „kar” i „nagród”, który pozwala komputerowi zorientować się, jaki rodzaj działań zbliża ją do celu, a jaki od niego oddala. Początki eksperymentu wyglądały dość zabawnie – np. w Breakoucie sztuczna inteligencja na oślep odbijała piłeczkę w różne strony, bardzo szybko przegrywając.


 

 


 

Cały system zbudowano w oparciu o standardowy serwer z procesorem Intel® Xeon®. W efekcie stworzony przez Polaków algorytm potrzebował mniej niż doby, by opanować grę na mistrzowskim poziomie i osiągać wyniki przewyższające możliwości ludzkich graczy. Niezbędne oprogramowanie współtworzyli inżynierowie z polskiego ośrodka badawczo-rozwojowego Intela w Gdańsku. Głównym celem było sprawienie, by program nie rozpraszał zadań na tysiące małych rdzeni, jak przy procesorach graficznych, ale optymalnie wykorzystał moc potężnych procesorów obliczeniowych Intel Xeon. Kolejnym krokiem było uruchomienie nauczania w systemach klastrowych. Pozwoliło to na skrócenie czasu nauki gry w River Raid czy Breakouta z 24 godzin do nawet kilkunastu minut.

 

Jednym z priorytetów Intela jest rozwój systemów sztucznej inteligencji, zdolnych ułatwiać życie jednostek, rozwiązywać problemy społeczne i unowocześniać pracę przedsiębiorstw. Już dziś uczenie maszynowe i głębokie rewolucjonizują sektory takie jak finanse i bankowość czy medycyna. Projekty prowadzone przez polskich naukowców i inżynierów wytyczają kierunki dalszego rozwoju prac nad możliwościami sztucznej inteligencji – mówi Artur Długosz z Intela.

 

Dlatego tak ważne są badania takie, jak te prowadzone przez deepsense.ai we współpracy Intelem. Opierają się one na wirtualnym, bezpiecznym środowisku oraz pozwalają na jednoczesne prowadzenie bardzo wielu powtórzeń i stałą optymalizację. Zdaniem ekspertów ciągu 10 lat na rynek trafią pierwsze powszechnie dostępne urządzenia wspomagające niepełnosprawnych, które wykorzystywać będą opisywane algorytmy uczenia się oparte na systemie nagród i kar.

 

Oczywiście tworzone algorytmy nie pozostają tylko programistycznym eksperymentem – wyjaśnia Tomasz Kułakowski, CEO deepsense.ai – Celem działania naszej firmy jest rozwój systemów sztucznej inteligencji, które będą zdolne do działania w naturalnym dla człowieka środowisku i w przyszłości ułatwią życie ludziom. Przykładem mogą być autonomiczne pojazdy czy roboty asystenckie, w szczególności te przeznaczone do pomagania niepełnosprawnym.

 

Tego typu eksperymenty mają niebagatelny wpływ na rozwój szeroko pojętej robotyki. Zanim roboty gotowe będą do towarzyszenia ludziom w życiu codziennym, musimy mieć pewność, że będą do tego perfekcyjnie przygotowane– dodaje Artur Długosz.