Biegłość i odpowiedzialność [Trzecia edycja ML in PL]

Czy na podstawie niepochlebnych komentarzy na forach internetowych można przewidzieć wyniki wyborów? To możliwe. Co więcej, takie podejście działa lepiej, niż gdybyśmy opierali szacunki na głosach poparcia. Najwyraźniej jesteśmy stali w antypatiach – dowodził Antoni Sobkowicz z OPI PIB na konferencji ML in PL

ML in PL to inicjatywa grupy studentów z Wydziału Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego (MIM UW), która w ciągu trzech lat wyrosła na jedno z ważniejszych wydarzeń w dziedzinie uczenia maszynowego w Polsce.

Wszystko zaczęło się od pomysłu prof. Krzysztofa Gerasa z Uniwersytetu Nowojorskiego. To on zasugerował studentom MIM UW zorganizowanie konferencji poświęconej uczeniu maszynowemu. Obiecał też wsparcie. W rezultacie od pierwszej edycji w roku 2017 na wydarzenie ściągają badacze z tak renomowanych ośrodków, jak Google Brain, DeepMind czy Microsoft.

W trzeciej edycji ML in PL, która w dniach 22–25 listopada odbyła się w Warszawie, wzięło udział ponad 50 prelegentów, m.in. z OpenAI, Uniwersytetu w Oxfordzie czy Uber AI Labs.

Po hejcie ich poznacie

Wykrycie wrogiego stosunku do polityków danego obozu nie nastręcza większych trudności. Trzeba tylko znaleźć słowa czy frazy, których najczęściej używają hejterzy – mówił Sobkowicz. Wbrew pozorom nie są to wcale pospolite przekleństwa (ich użycie wiąże się z ryzykiem blokady konta), lecz często dość wymyślne neologizmy czy pseudonimy.

Stworzenie zbioru wyrażeń nacechowanych emocjonalnie i wspierających jedną z opcji politycznych to pierwszy krok – wyjaśniał Sobkowicz. Następnie wykorzystuje się uczenie maszynowe, aby poszczególne frazy przypisać do konkretnych obozów politycznych. W kolejnym kroku trzeba przyporządkować autorów poszczególnych wpisów do określonych opcji. Na koniec wystarczy policzyć, ile jest takich osób.

Antoni Sobkowicz podczas prezentacji na konferencji ML in PL

Nienawistnicy w sieci okazali się prawdomówni. Prognozy wyborcze opracowane na podstawie stworzonego w OPI algorytmu okazały się bardziej precyzyjne od tradycyjnych sondaży.

Skąd tak wysoka trafność modelu? Sobkowicz tłumaczył, że algorytm miał do dyspozycji bardzo dużo danych: miliony jawnie opublikowanych komentarzy na otwartych platformach internetowych. Do określenia ostatecznego wyniku wyborów posłużono się danymi z ostatnich 10 dni poprzedzających ciszę wyborczą: ich ostateczny zbiór obejmował „tylko” 320 tysięcy komentarzy. Jednak do wcześniejszego wytrenowania algorytmów skorzystano z ponad 6 milionów wpisów!

Poprawność to nie wszystko

Katastrofa promu Challenger w styczniu 1986 roku kosztowała życie siedmiu osób. Doprowadził do niej splot różnych czynników, jednak dziś wiadomo, że usterki będącej bezpośrednią przyczyną eksplozji być może dałoby się uniknąć, gdyby nie nadmierna presja na inżynierów NASA, by jak najszybciej doprowadzili do startu promu. Marek Rogala z firmy Appsilon odniósł się do tego przykładu, aby zilustrować wyzwania stojące dziś także przed inżynierami SI.

Uczenie maszynowe wpływa na życie miliardów ludzi – argumentował. – Dlatego kryterium poprawności kodu nie wystarcza, by ocenić projekt SI. Dziś chodzi bowiem nie tylko o rekomendacje w sklepie internetowym czy poprawność wyników w wyszukiwarce, ale o kwestie znacznie poważniejsze, jak decyzje o przyznaniu zasiłku, kredytu czy przedterminowego zwolnienia. To często być albo nie być dla wielu ludzi. Dlatego inżynierowie nie mogą umywać rąk od efektów oddziaływania swojej pracy na społeczeństwo.

Jak się do tego zabrać? Przede wszystkim nie można lekceważyć potencjalnych skutków swojego działania. Nawet systemy, które nie są krytyczne, mogą mieć krytyczny wpływ na życie ludzi – mówił Rogala.

Przyjazna ludziom SI wymaga więc od inżynierów bliskiej współpracy z ekspertami z różnych dziedzin i unikania technologizmu, czyli bezrefleksyjnego kultu technologii. Potrzebna jest nowa kultura pracy: SI powinna być tworzona z myślą o jej całościowym oddziaływaniu, a nie tylko o poprawności technicznej i zysku.

Posłuchaj, by zobaczyć

O wyzwaniach związanych z percepcją wizualną maszyn mówił podczas wykładu inauguracyjnego prof. Josef Sivic z francuskiego instytutu badań cyfrowych Inria.

Widzenie maszynowe polega na wydobywaniu informacji z obrazów. Myliłby się jednak ten, kto utożsamiałby ludzki poziom rozumienia z możliwościami współczesnych maszyn. Dla nich obraz to wciąż zbiór pikseli o różnych właściwościach. Choć więc maszyny radzą dziś sobie nieźle z rozpoznawaniem twarzy czy tablic rejestracyjnych, to rozumienie złożonych relacji między obiektami w dynamicznie zmieniającej się sytuacji jest dla nich wciąż bardzo trudne.

Największe wyzwania z widzeniem maszynowym to dziś:

• Nauka wzorów, np. jak zdefiniować wygląd krzesła, które może mieć różne kształty.
• Generalizacja, czyli umiejętność rozpoznawania tych samych obiektów w nowych warunkach, np. po zmianie punktu widzenia, skali czy oświetlenia.
• Wnioskowanie na podstawie danych wizualnych, np. jak działanie zmienia stan przedmiotów.
• Umiejętność działania w świecie i nabywanie wiedzy na podstawie interakcji.

Niestety, nie jesteśmy w stanie wyczerpać wszystkich wariantów rzeczywistości i wyczerpująco ich opisać, by służyły maszynom – tłumaczył Sivic. Dlatego trzeba znaleźć inne rozwiązanie. Dość obiecujące efekty daje np. nauka z wykorzystaniem materiałów audiowizualnych, w których obrazowi towarzyszy narracja.

Świetnym materiałem treningowym są w tym przypadku internetowe tutoriale, wyjaśniające, jak wykonać jakąś czynność, np. przygotować potrawę czy zmienić koło w samochodzie. Dzięki temu, że na platformach typu wikiHow istnieją różne nagrania obrazujące wykonywanie tej samej czynności, maszyna może nauczyć się lepiej rozpoznawać, z czym ma do czynienia bez względu na zmianę perspektywy czy kąta widzenia. Jako pomoc służy tutaj narracja, która jest poddawana automatycznej transkrypcji i analizie w poszukiwaniu słów czy fraz kluczowych.

OPI PIB objął konferencję ML in PL patronatem honorowym, a serwis Sztuczna Inteligencja – medialnym.