Kidziński: Mamy poczucie, że zbawiamy świat

Kiedy rodzice zaczną podejrzewać u swojego dziecka jakąś chorobę neurologiczną, będą mogli po prostu je sfilmować, a algorytm postawi diagnozę. Z Łukaszem Kidzińskim z Uniwersytetu Stanforda rozmawia Monika Redzisz

Monika Redzisz: „Zastosowanie nowoczesnych metod analizy danych w biomechanice” – tym się oficjalnie zajmujesz na Uniwersytecie Stanforda. Czyli czym?

Dr Łukasz Kidziński*: Analizą ruchu, a konkretnie – analizą tego, jak pacjent chodzi. Porażenie mózgowe, udar mózgu, choroba Parkinsona i wiele innych chorób neurologicznych powodują zaburzenia ruchowe. Ilościowa ocena tego ruchu ma kluczowe znaczenie w terapii. To ważne zwłaszcza u dzieci. Najlepiej zdiagnozować je, kiedy tylko zaczną stawiać pierwsze kroki.

Dzisiaj dostępna jest jedynie bardzo kosztowna metoda zwana optical motion capture. Do ciała pacjenta przyczepione są markery, a on przechadza się po pokoju, w którym kamery rejestrują pozycję tych markerów. Na tej podstawie można wychwycić anomalie w ruchu i określić, na ile odbiegają one od normy. Niestety, to badanie kosztuje około 2 tysięcy dolarów i niewielu na nie stać.

Zaproponowałem metodę określania parametrów ruchu za pomocą sztucznej inteligencji. Nagrywamy film, na którym pacjent przechodzi przez pokój. Sieci neuronowe klatka po klatce analizują położenie ciała: lewe kolano, prawe kolano, lewa kostka, prawa kostka, lewe biodro, prawe biodro – i tworzą szereg czasowy tych punktów. Następnie druga sieć neuronowa używa tych szeregów czasowych, by postawić diagnozę i stworzyć metryki dla lekarza. Ważną informacją jest na przykład zakres ruchu kolana, bo niektórzy pacjenci z porażeniem mózgowym nie mogą go w pełni zgiąć, mają krótszy mięsień udowy.

Jak wytrenowaliście algorytm? Skąd dane?

Mieliśmy dostęp do dużego zbioru danych ze szpitala dziecięcego w Minnesocie, w którym, jak się okazało, od 30 lat nagrywano pacjentów, by ułatwić lekarzom postawienie diagnozy. Mamy bardzo dobre wyniki: 93 procent skuteczności w wykrywaniu anomalii. Naszą piętą achillesową jest jeden parametr, bo na nagraniach po prostu nie widać położenia kostki pod pewnym kątem. Tylko to nam obniża dokładność wyników do 93 procent, ale i tak jest ona na tyle wysoka, by algorytm stosować klinicznie. Mamy już prototyp; staramy się właśnie o publikację naszej pracy na ten temat w bardzo dobrym czasopiśmie naukowym.

Jak będzie wyglądało wdrożenie?

Każdy będzie mógł mieć w telefonie aplikację, najprawdopodobniej z ogólnie dostępnego i bezpłatnego źródła. I kiedy na przykład rodzice zaczną podejrzewać u swojego dziecka jakąś chorobę neurologiczną, będą mogli po prostu je sfilmować, zarejestrować sposób, w jaki chodzi, a algorytm postawi diagnozę, oczywiście wstępną.

Nagle zdajemy sobie sprawę, że przez dziesiątki lat robiliśmy coś złego – dyskryminowaliśmy kobiety czy Afroamerykanów – bo to od nas musiały się tego nauczyć nasze algorytmy

Podejrzewam, że większość rodziców dostanie rekomendację, by jednak zgłosić się do lekarza. Nie dlatego, że sieci neuronowe mogą działać nieprecyzyjnie, tylko dlatego, że wyniki trzeba jeszcze będzie poprawnie zinterpretować. Zawsze będzie lepiej z naszym raportem pójść do lekarza, a nie samemu podejmować ostateczną decyzję.

A co robisz w związku z projektem Google Street View?

Zaczęło się od projektu pracy doktorskiej mojej koleżanki Kingi Kity-Wojciechowskiej z Uniwersytetu Warszawskiego. Pracuje nad metodami analizy ryzyka w ubezpieczeniach samochodowych i zaprosiła mnie do współpracy przy tym projekcie. Firmy ubezpieczeniowe często określają poziom ryzyka wypadku na podstawie kodu pocztowego osoby, która zgłasza się po polisę. Jeśli mieszka w „złej” dzielnicy, płaci wyższe ubezpieczenie, bo rośnie prawdopodobieństwo zniszczenia samochodu. Jednak w ramach jednego kodu pocztowego może być kilka adresów – „lepszych” i „gorszych”. Mogą pojawić się jakieś dodatkowe informacje, które wpływają na jedno miejsce, a na drugie nie.

Jeśli mieszkam nad sklepem monopolowym, to ryzyko tego, że mój samochód ucierpi, rośnie.

Właśnie tak. To samo dotyczy ryzyka ubezpieczenia mieszkania przed kradzieżą itp. Chcieliśmy więc zejść do poziomu konkretnego adresu, a nie samego kodu pocztowego. Zastanawialiśmy się, jakie informacje można użyć do predykcji ryzyka i skąd je wziąć. Doszliśmy do wniosku, że to, jak wygląda konkretny budynek, widać na zdjęciu satelitarnym. Okazało się, że w mniej zadbanych domach mieszkają osoby, które częściej zgłaszają szkody. W modelu wciąż mamy kod pocztowy, który bierze pod uwagę, czy chodzi o centrum Warszawy, czy o małe miasteczko, ale dodatkowo jeszcze różnicujemy zadbane i niezaniedbane budynki.

To może być bardzo mylące. Kamienica malowniczo nadgryziona zębem czasu, w której mieszkania kosztują bajońskie sumy (a więc mieszkają tam zwykle zamożni ludzie), będzie oceniona jako bardziej ryzykowna niż świeżo odmalowany blok z lat 60.

Tak. Wyjątki to standardowy problem w metodach statystycznych. Firmy ubezpieczeniowe ustalają wyższe stawki osobom, które jeżdżą czerwonymi samochodami. Bo statystycznie rzecz biorąc, świadczy to o bardziej agresywnej jeździe – co jednak wcale nie znaczy, że każdy właściciel czerwonego samochodu jeździ agresywnie.

To jednak metoda dyskryminująca mniej zamożnych.

Owszem. W Stanach ma to jeszcze dodatkowy aspekt – aspekt rasowy, bo wciąż istnieje tam korelacja pomiędzy dzielnicą i stanem jej budynków a kolorem skóry ich mieszkańców. Google Street View nie jest niewinnym narzędziem. Pozwala wyciągnąć informacje o każdym z nas, i to bez naszej zgody. Dla nas, naukowców, to interesujące teoretyczne zagadnienie, ale dostaliśmy te dane od konkretnej firmy ubezpieczeniowej, która chce na tym zarabiać. Na pewno wiele firm ubezpieczeniowych próbuje już stosować te metody.

Często spotykasz się z dyskryminującymi algorytmami?

Tak. Model jest z reguły reprezentacją danych, których się do tego modelu używa. To ciekawe, że zaczynamy się zastanawiać nad tym dopiero wtedy, kiedy widzimy błędy algorytmów. Trochę jak rodzice, którzy przeglądają się w zachowaniach swoich dzieci. Nagle zdajemy sobie sprawę, że przez dziesiątki lat robiliśmy coś złego – dyskryminowaliśmy kobiety czy Afroamerykanów – bo to od nas musiały się tego nauczyć nasze algorytmy. Myślę, że w Europie jest pod tym względem znacznie gorzej niż w Stanach; tam przynajmniej się o tym dużo mówi. Europa dopiero dojrzewa do takich dyskusji.

Mieszkasz w Dolinie Krzemowej, pracujesz na Stanfordzie. Masz poczucie, że żyjesz w elitarnej enklawie?

Tak, to się da odczuć. Na uniwersytecie budujemy modele, które będą umiały lepiej przewidywać progresję choroby. Mamy poczucie, że zbawiamy świat. Czasem zapominamy, że są miejsca na świecie, gdzie ludzie nie mają dostępu do bieżącej wody i skala ich problemów jest znacznie większa od tych, z którymi my mamy do czynienia. Ale to nie dotyczy tylko Doliny Krzemowej. To samo czuję, wracając do Polski. Polska także jest już elitarnym miejscem, jeśli porównać ją z 80 procentami miejsc na świecie. Ale większość z nas nie zdaje sobie z tego sprawy.

*Dr Łukasz Kidziński – matematyk i informatyk po Uniwersytecie Warszawskim. Doktorat ze statystyki matematycznej zrobił na uniwersytecie w Brukseli. Potem trafił do zespołu CHILI (Computer-Human Interaction in Learning and Instruction) w Lozannie, gdzie zajmował się interakcją człowieka z robotami. Tam także stworzył ogólnodostępną platformę deepart.io, na której sieci neuronowe dowolne zdjęcie są w stanie przetworzyć na obraz malarski w wybranym przez siebie stylu. Od trzech lat pracuje na Uniwersytecie Stanforda w USA, specjalizując się w badaniach na styku informatyki, statystyki i bioinżynierii. Należy do zespołu Mobilize Center, który zajmuje się analizą danych i wdrożeniami w dziedzinie zdrowia.

Read the English version of this text HERE