Google właśnie stworzyło moją fałszywą wersję

0
8

Na zewnątrz jest ciepło. I nie tylko „nie zimno”, ale naprawdę ciepło, co jest bardzo rzadkie w Dolores Park. Stoję nieruchomo. Przede mną dinozaur – prehistoryczny i cierpliwy. Śpiewam mu. Pojawia się babeczka. Różowa świeca. Magiczna sztuczka czy usterka oprogramowania? Zdmuchuję świeczkę i potwór CGI wygląda na szczęśliwego. Prawie zadowolony.

Osoba, która śpiewa, wygląda jak ja. Brzmi prawie jak ja. Ale to nie ja.

Ten film powstał przy użyciu Google Gemini. Nowa funkcja awatara. Klonuje Twój głos i twarz, a następnie umieszcza tę cyfrową kopię w filmie. Technologia opiera się na modelu Omni, nowym modelu wideo firmy. Aby z niego skorzystać, potrzebujesz subskrypcji Pro za 20 USD.

Szybko osiągnąłem swój limit. Limit resetuje się co pięć godzin. Zadałem kilka pytań, stworzyłem dwa krótkie filmy, po czym mnie zablokowali. „Czekaj” – napisał bot. Trochę szorstko.

Dwa filmy. Dinozaur. Surfer pod Złotą Bramą. Wygląda imponująco. Dziwny. I trochę śmieszne. Logika jest łamana wszędzie. Ubrania, które nie mają żadnego sensu. Ale twarz… jeśli przyjrzysz się uważnie, zęby są lekko krzywe. Ale dodatkowy tłuszcz na brodzie? On tam jest. To jest Risi 2.0. OpenAI miało Sorę. Pozwolili ludziom klonować innych. Google tego nie robi. Dorośli mogą klonować się tylko sami. Przynajmniej na razie.

Wszystko zajmuje pięć minut. Jasny pokój. Aparat telefoniczny. Czytanie na głos liczb dwucyfrowych. Patrzysz w prawo. Odwracasz głowę w lewo. Gotowy. * Zachowaj ostrożność przy wyborze ubioru. Twoja ulubiona kurtka dżinsowa może stać się dla Ciebie więzieniem sztucznej inteligencji.*

Obejrzyjmy urodzinowy film.

Prośba: Wygeneruj film, w którym śpiewam „Happy Birthday” staremu dinozaurowi na wzgórzu w parku Dolores.

Wszystko zaczyna się od pauzy. Niezdecydowanie milenijne. Tło jest przerażająco dokładne. To nie jest jakiś abstrakcyjny park. To jest ten park. Palmy. Dominująca wieża Salesforce. Google mapuje cały świat, pamiętasz? Znają geometrię wzgórz.

A potem się to śpiewa. Baryton jest lepszy niż mój. Głos nie drży. Ręce klaszczą do rytmu niczym miniaturowy dyrygent. Następnie pojawia się słowo „do”. I zaczyna się jąkanie. Aparat wykonuje zbliżenie, tworząc długie ujęcie. Chaos. Babeczka znika? Pojawia się? Czy wydycham dym? Zdmuchnąć świeczkę? Surowa sztuczna inteligencja. Właściwie to były moje urodziny.

Drugi film. Surfer.

Prośba: Wygeneruj film przedstawiający mój surfing na desce pod mostem Golden Gate.

Dżinsowy garnitur. Bez butów. Dziwny wybór do zabiegów wodnych. Kąt kamery przypomina kamerę GoPro przyklejoną do tablicy. Tekstura jest realistyczna. Nie ma logiki.

Kobiety są bardziej dotknięte tą technologią. Deepfake tworzone bez zgody ludzi to koszmar. Google twierdzi, że bezpieczeństwo jest najważniejsze.

„Staramy się zapobiegać szkodom” – powiedziała mi Nicole Brechtova z DeepMind. „Ale nie blokujemy rzeczy nieszkodliwych”.

Balansować? Może.

Jąkanie jest oczywiste. Błędy wyjdą na jaw. A jednak.

Uczucie pozostaje. Te filmy wydają się bardziej realne niż moja ostatnia wiadomość głosowa czy nagranie, na którym jestem w piątek przy barze. Avatar nie jest ładniejszą ani lepszą wersją. Nie.

To tylko ja. Ale zawsze gotowy. Gdziekolwiek. Zawsze występujący.