Sztuczny prezenter zrelacjonuje mecz – Sztuczna Inteligencja

Reuters stworzył wirtualnego prezentera sportowego, który może relacjonować mecze bez udziału człowieka

Brytyjska agencja informacyjna zaprezentowała pierwszy całkowicie zautomatyzowany system relacjonowania wydarzeń sportowych. Twarzy użyczył mu znany dziennikarz. Technologia przypomina nieco deepfakes, z tym że w tym przypadku przekazywane wiadomości są jak najbardziej prawdziwe. Rezultatem jest wideo, na którym prezenter relacjonuje przebieg meczu piłki nożnej. Za stworzenie klipu w całości odpowiada sztuczna inteligencja.

System składa się z dwóch części. “Najpierw używamy algorytmu, by zsynchronizować fotografie i raporty z meczu ze strumieniem danych opisującym minuta po minucie co działo się na boisku, łącząc w ten sposób słowa opisujące wydarzenie z odpowiadającymi im obrazami” – mówi Forbes’owi Nick Cohen z Reutersa.

W drugim kroku na podstawie tych danych jest generowany film wideo z udziałem wirtualnej kopii prezentera sportowego Ossiana Shine’a, która powstała w generatywnej sieci przeciwstawnej (GAN) wytrenowanej na klipach wideo z udziałem prezentera.

Jak przypomina Forbes, Reuters już od jakiegoś czasu używa algorytmów do automatycznego generowania relacji z wydarzeń sportowych. W tym przypadku idą jednak o krok dalej – łączą swój system z platformą mediów syntetycznych, pozwalającą włożyć wygenerowane treści w usta wirtualnego prezentera.

Reuters podkreśla, że to rozwiązanie nie wymaga udziału człowieka w tworzeniu scenariusza, edytowaniu i produkcji – za wszystko odpowiada sztuczna inteligencja.

Technologia przypomina nieco deepfakes, z tym że w tym przypadku przekazywane wiadomości są jak najbardziej prawdziwe

Technologię odpowiedzialną za wygenerowanie wirtualnego Osiana Shine’a stworzono we współpracy z brytyjskim startupem Synthesia.

“System używa sztucznej inteligencji, by przeanalizować materiały wideo i buduje cyfrową kopię prezentera. To trochę tak, jak robi się w Hollywood, by wykreować cyfrowego bohatera (jak Benjamin Button, albo wirtualni bohaterowie w filmach science fiction), z tym że wygenerowanie sceny nie trwa miesięcy, czy lat – my możemy zrobić to w ciągu godzin” – mówi Forbes’owi prezes firmy Victor Riparbelli.

W zeszłym roku chińska agencja Xinhua zaprezentowała swojego wirtualnego prezentera. System Reutersa to jednak krok do przodu – chiński awatar czytał wiadomości przygotowane przez ludzi. Rozwiązanie brytyjskiej agencji automatyzuje cały proces produkcji wideo.

Wprowadzenie systemu drastycznie zmniejszyłoby koszt produkcji telewizyjnej i umożliwiło automatyczną obsługę wielu wydarzeń na raz. Możemy sobie wyobrazić pana Shine’a, który symultanicznie relacjonuje kilkanaście spotkań – od najważniejszych meczów na całym świecie, bo rozgrywki trzeciej ligi angielskiej.

Projekt jest na etapie prototypu. “Reuters od dawna jest w awangardzie jeśli chodzi o odkrywanie potencjału nowych technologii w dostarczaniu wiadomości. Ten prototyp pomaga nam zrozumieć jak można łączyć sztuczną inteligencję i media syntetyczne z naszymi tworzonymi na bieżąco strumieniami fotografii i relacji w celu stworzenia nowego rodzaju produktów i usług” – mówi Nick Cohen w wypowiedzi cytowanej na stronie Reutersa.