Mirosław Sopek: Naszą prywatność ocali mechanika kwantowa

KONIEC PRYWATNOŚCI?! GŁOS NA „NIE”. Nie wierzę w katastroficzne teorie, które mówią, że wraz z rozwojem technologii musimy stać się od niej zależni i nie będziemy w stanie jej kontrolować – mówi Mirosław Sopek z firmy MakoLab w rozmowie z Moniką Redzisz

Monika Redzisz: Rzeczywiście musimy się pogodzić z utratą prywatności? Nie ma nadziei?

Mirosław Sopek*: Ależ absolutnie jest! Istnieją rozwiązania technologiczne, które mogą nas ochronić przed tą ponurą wizją. Profilowanie nas na podstawie tego, co robimy w sieci, jeszcze mnie tak bardzo nie przeraża.

Prawdziwym zagrożeniem jest to, co się dzisiaj dzieje w Chinach. Tam profilowanie połączone z uczeniem maszynowym już doprowadza do sytuacji autentycznie orwellowskich. Jeśli rodzice mają złe notowania w systemie social scoring, to ich dzieci nie pójdą do dobrej szkoły. Są ludzie, którzy w zasadzie nic złego nie zrobili, nie są przestępcami, ale na przykład w sposób nieco frywolny traktowali swoje zobowiązania wobec operatorów sieci komórkowej. Za karę nie mogą więc kupić biletu na samolot ani na pociąg. Takich ludzi jest kilkanaście milionów! Ta inwigilacja idzie za daleko. Jeżeli popełniłem błąd, zakłada się, że popełnię go znowu, a na dodatek cierpią na tym moje dzieci. Tak nie powinno być!

To straszne, choć na razie możliwe tylko w takim kraju jak Chiny.

Ale popatrzmy, co się dzisiaj dzieje wokół nas. Tak, jesteśmy przyzwyczajeni do demokracji, w Europie chroni nas RODO, ale tendencje są niepokojące. Wielu polityków na szczytach władzy wcale nie ukrywa tego, że część zdobyczy demokracji liberalnej uważa za zło. To zaczyna być groźne. Na szczęście są mądrzy ludzie, którzy tworzą rozwiązania techniczne chroniące naszą prywatność. Jest nadzieja.

Jakie to rozwiązania?

Projekt Semantic Web, wymyślony przez Tima Bernersa-Lee. To człowiek, który w 1989 roku stworzył sieć WWW; mój guru i być może niedługo partner w biznesie.

Naszym fundamentalnym problemem dziś jest to, że kiedy opublikujemy swoje dane w pewnym systemie, to ten system staje się ich właścicielem

Sieć ma zaledwie 31 lat, a już zrewolucjonizowała nasz świat. W 2004 roku, wraz z powstaniem Facebooka, mieliśmy jeszcze jedną rewolucję: media społecznościowe, czyli Web 2.0. Następnie Tim Berners-Lee stworzył podwaliny pod coś zupełnie nowego: Semantic Web, sieć semantyczną, którą nazywam Siecią Pełną Znaczeń.

Na czym polega?

Idea jest szalenie prosta. Polega na zastąpieniu naszych dzisiejszych linków linkami „inteligentnymi”. Wykorzystujemy to, co znamy z logiki – klasy i relacje – a definiuje je coś, co nazywamy ontologią. Nie jest to oczywiście ontologia rozumiana filozoficznie. Mówiąc w uproszczeniu, to ontologia „techniczna”. Tworzymy metadane – warstwę inteligentną, która klasyfikuje dane, pokazuje je w kontekście innych danych, a wreszcie umożliwia przeprowadzenie wnioskowania logicznego. Pozwala to algorytmom lepiej, „inteligentniej” przetwarzać informacje, na przykład otrzymywać informacje nie podane explicite, ale wynikające z kontekstu.

To już działa w przestrzeni publicznej. Google kupił w 2013 roku firmę specjalizującą się w tej dziedzinie i wytworzył gigantyczną sieć grafową z danych z Wikipedii i innych źródeł. Na każdej dobrze zrobionej stronie powinny być już schematy linkujące, definiujące daną osobę, organizację, miejsce czy zjawisko w sposób kontekstowy.

A jak to się ma do prywatności naszych danych?

Naszym fundamentalnym problemem dziś jest to, że kiedy opublikujemy swoje dane w pewnym systemie, to ten system staje się ich właścicielem. Nie możemy wytoczyć Facebookowi procesu, że sprzedaje informacje na nasz temat marketerom, ponieważ sami, z wolnej woli stworzyliśmy tam swoje konto i dobrowolnie ujawniliśmy informacje na swój temat. Tak jest to zorganizowane na poziomie technicznym i biznesowym.

Tim wymyślił system, w którym nasze dane zawsze należą do nas. Do 2017 roku był dyrektorem W3C, konsorcjum, które dba o standardy w sieci. Miał do czynienia między innymi ze słynnym raportem, który pokazał, jak gigantyczny wpływ na brexit miały mechanizmy profilowania. Po skandalu z Cambridge Analytica przeżył szok. Uznał, że to się posuwa za daleko. Postanowił zaprojektować platformę, na której nasza prywatność będzie bezpieczna. To Solid (Social Linked Data).

Istnieje już przecież sieć TOR o cebulowej strukturze. Tam nasza tożsamość jest chroniona.

TOR usuwa z warstw sieciowych wszelkie mechanizmy, które pozwalają nas łatwo namierzyć. Nie można rozpoznać naszego adresu IP, ale to nie jest coś, co daje ochronę danych jako takich. Jeśli ktoś zechce opublikować jakiś zbiór naszych danych, to czy on będzie w TOR, czy nie w TOR, ten ktoś będzie mógł je ukraść. Semantic Web działa inaczej: tu mogę mieć absolutną kontrolę nad tym, co moje. Jeśli Facebook zechce z moich danych skorzystać, będzie musiał mnie pytać o zgodę.

To kwestia ustalenia innych zasad?

To coś więcej niż zasady. Nigdy nie mamy przecież pewności, że zasady będą przestrzegane. To zmiana na poziomie technologii. Zmienia się tu cała architektura systemu. Nasze dane, zdjęcia, filmy, informacje, zamknięte w specjalnych kapsułkach, będą pod naszą kontrolą. Teraz, kiedy piszę coś na FB, moje dane trafiają do fejsbukowych serwerów baz danych. Facebook może mi je potem udostępnić, ale one fizycznie są u niego. Tim Berners-Lee odwrócił tę sytuację. Dane zapisane są w mojej kapsułce i to FB musi prosić mnie o ich udostępnienie. I nawet jeśli się zgodzę, to one nadal są u mnie. Kapsułki mogą swobodnie przenosić się pomiędzy różnymi serwisami.

Skąd będziemy brać te kapsułki?

Start-up Tima chce je tworzyć i udostępniać za darmo.

W jakiej warstwie nastąpiłaby ta zmiana?

Na poziomie http i troszkę wyżej – można powiedzieć, że w wyższych warstwach protokołów sieciowych. Tu nie byłoby jak w TOR, gdzie odbywa się to na niskich poziomach sieci VPN. Semantic Web jest bardzo silnie związany z protokołem http. Projekt Solid funkcjonuje na poziomie warstw API, trochę wyżej niż http. Jest tam obszar nazywany Link Data Container, można go sobie wyobrazić jako folder. To nasze dane plus druga warstwa – metadane, które je opisują; można powiedzieć – katalog w formie grafu. A więc cała semantyka, linki, a także uprawnienia: co komu chcę dać, na co się zgadzam.

W tej chwili zabezpieczamy nasze dane, naszą prywatność szyframi. Jednak kiedy powstaną komputery kwantowe, szyfry, których dzisiaj używamy, przestaną nas chronić

Czy to oznacza, że całą infrastrukturę internetu trzeba by zbudować od początku?

Nie! To może funkcjonować z dzisiejszym Facebookiem czy Amazonem. Różnica będzie polegać tylko na tym, kto będzie posiadał dane.

To realne? W jakiej to jest fazie technicznej?

Jeszcze wczesnej, ale bardzo wybitni ludzie za tym stoją. To bardzo świeża sprawa. Tim na pomysł Solida wpadł w 2016 roku. Ma już finansowanie 20 mln dolarów, w tej chwili szuka partnerów, którzy będą z nimi współpracowali. Nasza firma też jest na tej liście, czekamy na informację, czy przyjęli nas do swego grona. Są tacy, którzy mówią, że to się nigdy nie uda, ale ja bardzo w to wierzę.

Kiedy raz udostępnię komuś pewną informację na swój temat, to skąd będę miała pewność, że on nie skopiuje jej sobie i nie użyje ponownie w sobie tylko wiadomym celu? Poza tym jak to się ma do chmur, w których wszyscy dziś zapisujemy nasze dane?

Będziemy mogli dalej je tam trzymać. Po prostu dane muszą być odpowiednio zabezpieczone. Dochodzimy tu do kryptografii. W tej chwili zabezpieczamy nasze dane, naszą prywatność szyframi. Jednak kiedy powstaną komputery kwantowe, szyfry, których dzisiaj używamy, przestaną nas chronić. I tu pojawia się nazwisko wybitnego Polaka, prof. Artura Ekerta, który w National University of Singapore prowadzi katedrę obliczeń kwantowych. Jest współtwórcą najważniejszej dziedziny zapewniającej możliwość ochrony prywatności – kryptografii kwantowej. Wymyślił metodę transmisji danych różnych kwantowych obiektów za pomocą światłowodów, która gwarantuje poufność. To absolutnie najgenialniejsza metoda szyfrowania, jaką można sobie wyobrazić.

Na czym polega?

Co jest ostatecznym zabezpieczeniem prywatności? Umowa między ludźmi: kiedy ja i pani umawiamy się, że nasza rozmowa jest prywatna. Ekert wymyślił algorytm, który opiera się na istnieniu tak zwanych monogamicznych korelacji. W mechanice kwantowej dwa obiekty są ze sobą związane na zawsze: gdy jeden się poruszy, to drugi też. Nie ma fizycznej możliwości, żeby dopuścić trzecią stronę.

Wyniki badań na ten temat zostały opublikowane m.in. w „Nature”. Pamiętam stamtąd takie piękne zdanie: „Monogamiczne korelacje jakiegokolwiek rodzaju i wolna wola wystarczą, aby ochronić naszą prywatność”. Prywatność gwarantowana przez mechanikę kwantową – czy to nie jest piękne!?

Ta metoda zabezpieczania będzie tak mocna, że żaden Amazon, IBM czy Facebook nie będzie w stanie naszych kapsułek odszyfrować. Nikt nie złamie naszej prywatności.

Pan zajmuje się fizyką kwantową?

Jestem chemikiem teoretykiem, ale pisałem też sporo prac z fizyki kwantowej jeszcze przed założeniem firmy. Teraz do tego wracam. Uczestniczę na przykład w ciekawym projekcie, gdzie celem jest stworzenie blockchainu, który oprze się komputerom kwantowym.

Przecież na razie nie ma nawet pomysłu na to, jak komputery kwantowe mogłyby funkcjonować.

Nie wiemy jeszcze, jaki będzie nośnik fizyczny, ale to tylko chwilowy technologiczny problem. Ważne jest to, że ta metoda jest oparta na podstawowych zjawiskach mechaniki kwantowej, a one działają wszędzie.

Powiedzmy, że wszystkie problemy technologiczne zostaną rozwiązane i powstanie platforma Solid. To rewolucyjny pomysł. Czy nie nazbyt rewolucyjny dla tych, którzy dziś bogacą się na naszych danych?

Oczywiście, wymaga zmiany modelu biznesowego. Ale jestem w stanie wyobrazić sobie funkcjonowanie takiego modelu. Wszyscy musimy zrozumieć istotę tej rewolucji. Proszę zwrócić uwagę na to, jak wielkie jest niezadowolenie społeczne, ilu jest takich, którzy mówią: „Nie chcę mieć już nic wspólnego z Facebookiem. Wypisuję się”.

A rządy, służby specjalne, wojsko? Wszyscy ci, którym zależy na inwigilacji ze względu na bezpieczeństwo kraju lub poszczególnych obywateli?

Oczywiście, z tym może być problem, ale mam nadzieję, że istnieje możliwość kompromisu. Musimy ustalić zasady, jakimi powinny kierować się rządy, firmy i obywatele, aby sieć była z jednej strony bez cenzury, ale z drugiej strony by nie naruszała prywatności. Ja sam jestem członkiem stowarzyszenia Data Coalition w Stanach, które jest najsilniejszą grupą lobbującą na rzecz zachowania otwartości i prywatności danych. To grupa ponad podziałami politycznymi.

Wspomniał pan, że być zostanie pan partnerem biznesowym Tima Bernersa-Lee. Jak to się w ogóle stało? Jak trafił pan do Ameryki?

W 1989 roku rozluźniłem związki z uczelnią i założyłem w Łodzi swoją firmę, MakoLab. Zajmujemy się szeroko pojętymi usługami cyfrowymi dla firm. W 1996 ściągnęła mnie do Kanady firma Hypercube i przez kolejne kilka lat krążyłem pomiędzy Kanadą, Stanami Zjednoczonymi a Polską. Kiedy weszliśmy do Unii, utworzyłem oddziały MakoLab w Paryżu i Londynie. W 2007 weszliśmy na giełdę w Warszawie. Wtedy stwierdziłem, że mogę już „mentalnie” inaczej funkcjonować w firmie. Usunąłem się z zarządzania i zainteresowałem Siecią Pełną Znaczeń. Kiedyś na konferencji w Bostonie spotkałem szefa firmy, w której pracowałem w Kanadzie. „Słuchaj, ty się zajmujesz Semantic Web” – mówi do mnie. „Zróbmy coś z tym”. I tak założyliśmy w Gainesville na Florydzie start-up Chemical Semantics i zajęliśmy się przekształcaniem sposób opisu danych w chemii. Stosowaliśmy semantyczne mechanizmy do ich opisu, żeby były bardziej zrozumiałe w cyfrowym świecie.

By miały swój metaopis?

Dokładnie. Zostaliśmy autorami ontologii, którą nazwaliśmy dumnie Gainesville Core (odnosząc się do najważniejszej ontologii semantycznej Dublin Core). Jednak w pewnym momencie wizje moje i mojego wspólnika rozjechały się, więc się wycofałem, a niedługo później założyłem oddział MakoLab w USA. W 2018 uruchomiłem także kolejny start-up, który już jest własnością MakoLabu w 100 procentach. Stosujemy techniki semantyczne do opisania istotnych danych dotyczących firm w skali globalnej. Nasz sukces zależy jednak od losów systemu publicznego, którego sytuacja jest w tej chwili niepewna. Chodzi o mechanizm, który można rozumieć jako „globalny numer VAT”: wszystkie firmy na świecie mają mieć jednolity kod identyfikacyjny. Na świecie jest 200 milionów firm, za kilka lat miałbym je wszystkie w moich bazach. Niestety w 2019 Unia Europejska wycofała się z tego pomysłu. Owszem, sam pomysł jest genialny, ale źle pomyślany, jeśli chodzi o finansowanie, bo finansują go firmy. O ile 100 dolarów dla amerykańskiej czy polskiej firmy to nic, to dla firmy w Bangladeszu to zbyt duży wydatek.

Jak Sieć Pełna Znaczeń ma się do sztucznej inteligencji?

Pomysł Tima Bernersa-Lee nie dotyczy sztucznej inteligencji jako takiej, ale jeśli połączymy metody machine learning z technikami semantycznymi, uzyskujemy coś, co pozwala nam lepiej zrozumieć, jak działają algorytmy ML. Dzisiaj wszyscy zachłystują się automatycznym rozpoznawaniem twarzy czy głosu i jeszcze nie rozumieją, jakie znaczenie dla sztucznej inteligencji ma semantyka. Tymczasem semantyka pozwala odbudować nam wiarę w to, że coś, co uważamy za kanon wiedzy od 2,5 tysiąca lat, podział wiedzy według Arystotelesa, coś, co daje nam konceptualne ramy myślenia o świecie – da się również zastosować w uczeniu maszynowym. To dzięki semantyce możemy liczyć na zrozumienie działania algorytmów.

Semantyka pozwala odbudować nam wiarę w to, że coś, co uważamy za kanon wiedzy od 2,5 tysiąca lat, da się również zastosować w uczeniu maszynowym

Teraz jadę samochodem autonomicznym i nie wiem, dlaczego się zatrzymał. Na co zareagował? Nie wiadomo. Zareagował tak, jak nauczyły go algorytmy. Połączenie ich z semantyką pozwoli nam zrozumieć przyczynę konkretnych decyzji. Algorytmy banku odrzucają wniosek kredytowy i nie wiadomo, dlaczego, bo nie podają argumentów. Albo taki system predykcji zdrowia pacjentów – sieć neuronalna klasyfikuje ludzi pod względem podatności na schizofrenię, ale na jakiej dokładnie podstawie, tego nie wiemy.

Czy to oznacza rozpakowanie czarnej skrzynki?

Tak! Dlatego flirt z semantyką jest właśnie najciekawszym fragmentem rozwoju machine learningu. Na pewno wszyscy skorzystamy z ich symbiozy. Może wkrótce unikniemy sytuacji, kiedy algorytmy coś wskazują, a my musimy ślepo w to wierzyć i za tym podążać.

A pamiętam, jak jeszcze w 2008 roku wszyscy w semantyce odżegnywali się od SI, bo SI było niemodne. Teraz wróciło do łask. Myślę, że na wszystko trzeba czasu; być może tyle lat musiało upłynąć. Dzisiaj semantyka oznacza szansę na to, żeby czarne skrzynki SI nabrały trochę ludzkiej inteligencji.

Wierzy pan, że najnowsze technologie odwrócą negatywne procesy cywilizacyjne, z którymi się borykamy?

Nie wierzę w katastroficzne teorie mówiące, że wraz z rozwojem technologii musimy stać się od niej zależni i nie będziemy w stanie jej kontrolować. Nie wierzę, bo w ramach tych samych technologii istnieją mechanizmy, które mogą nas przed tym chronić. Natomiast nie podejmuję się próby powiedzenia, czy rzeczywiście uchronią. Rozwiązania technologiczne takie jak kryptografia kwantowa czy semantyka mają duży potencjał. Naukowcy dokonują wielu wspaniałych odkryć, które są dla nas dobrodziejstwem, ale politycy robią swoje. Na przykład Polska, która ma największy problem z ochroną środowiska w Europie, powinna być pierwsza w działaniu. A co robimy? Niewiele.

*Dr Mirosław Sopek – absolwent Wydziału Fizyki Technicznej i Matematyki Stosowanej Politechniki Łódzkiej. Tytuł doktorski otrzymał na Wydziale Chemicznym w zakresie Chemii Teoretycznej. Pracował jako asystent i wykładowcą na Politechnice Łódzkiej (modelowanie molekularne), Akademii Humanistyczno-Ekonomicznej (e-commerce/kryptografia) oraz w Szkole Filmowej w Łodzi (grafika komputerowa).

W 1989 roku założył firmę MakoLab. W latach 1996-2000 pracował za granicą: najpierw jako naukowiec i programista w HyperCube w Kanadzie, a następnie jako kierownik projektów informatycznych i projektant systemów w HyperCube w USA. Był szefem Chemical Semantics na Florydzie. Od 2016 roku zarządza amerykańskim oddziałem MakoLab, a w roku 2018 uruchomił start-up LEI.INFO działający w obszarze identyfikacji cyfrowej firm.

Pod jego kierunkiem spółka MakoLab przekształciła się w Agencję Rozwiązań Cyfrowych i specjalizuje się w usługach cyfrowych dla sektora motoryzacyjnego i finansowego. Posiada oddziały zagraniczne w Paryżu, Londynie i USA.

Nadzorował powstanie zespołu Badań i Rozwoju w MakoLab SA, który zajmuje się m.in. technologiami semantycznymi. Trzykrotnie organizował międzynarodowe konferencje (MakoLab Semantic Day w Paryżu i w Warszawie) oraz rozpoczął współpracę MakoLab z zespołem schema.org (konsorcjum Google, Bing & Yahoo) i konsorcjum EDMC (zrzeszającego firmy sektora finansowego). W ramach tej współpracy powstały rozszerzenia schema.org dla przemysłu motoryzacyjnego oraz dla bankowości. Jest założycielem i współzarządzającym dla dwóch wspólnot w ramach konsorcjum W3C – GAO (ontologie motoryzacyjne) i FIBO (ontologia finansowa). Obecnie rozwija nowatorskie rozwiązania w ramach technologii blockchain (GraphChain oraz Kwantowy Blockchain).

Mirosław Sopek i Michał Kosiński byli gośćmi ostatniego spotkania HumanTech Meetings, które odbyło się 17 grudnia 2019 roku i zatytułowane było „Śladami Big Data”. Spotkania te odbywają się cyklicznie w ramach projektu Centrum Innowacji HumanTech na warszawskim Uniwersytecie SWPS. Dziękujemy organizatorom za zaproszenie i pomoc w realizacji materiału.

Read the English version of this text HERE