На улице тепло. И не просто «не холодно», а по-настоящему тепло, что для парка Долорес большая редкость. Я стою на месте. Передо мной динозавр — доисторический и терпеливый. Я пою ему. Появляется капкейк. Розовая свеча. Волшебный трюк или программный сбой? Я задуваю свечу, и это CGI-чудовище выглядит довольным. Почти самодовольным.
Человек, который поет, выглядит как я. Звучит почти как я. Но это не я.
Этот ролик сделан с помощью Google Gemini. Новая функция аватаров. Она клонирует ваш голос и лицо, а затем помещает эту цифровую копию в видео. Технология построена на модели Omni, новой видео-модели компании. Чтобы ей пользоваться, нужна подписка Pro за $20.
Я быстро исчерпал лимит. Лимит сбрасывается каждые пять часов. Я задал несколько вопросов, создал два коротких видео, а потом меня заблокировали. «Подождите», — написал бот. Немного грубовато.
Два ролика. Динозавр. Сёрфер под Золотыми Воротами. Выглядит впечатляюще. Жутко. И немного нелепо. Логика повсюду нарушена. Одежда, которая не имеет никакого смысла. Но лицо… если приглядеться, зубы слегка кривые. А вот лишний жирок на подбородке? Он на месте. Это Риси 2.0. У OpenAI был Sora. Они позволяли людям клонировать других. Google этого не делает. Взрослые могут клонировать только себя. По крайней мере, на данный момент.
На всё уходит пять минут. Светлая комната. Камера телефона. Читаешь вслух двузначные числа. Смотришь вправо. Поворачиваешь голову влево. Готово. Будь осторожен с выбором одежды. Любимая джинсовая куртка может стать для тебя тюрьмой искусственного интеллекта.
Давай посмотрим на видео с днём рождения.
Запрос: Сгенерируй видео, где я пою «Happy Birthday» старому динозавру на холме в парке Долорес.
Начинается всё с паузы. Миллениальная нерешительность. Фон пугающе точный. Это не какой-то абстрактный парк. Это тот самый парк. Пальмы. Доминирующая башня Salesforce. Google картирует весь мир, помните? Они знают геометрию холмов.
А затем поётся. Баритон лучше моего. Голос не дрожит. Руки хлопают в такт, словно у миниатюрного дирижёра. Затем доходит до слова «to». И начинается заикание. Камера отъезжает в общий план. Хаос. Капкейк исчезает? Появляется? Я выдыхаю дым? Чтобы задуть свечу? Грубый ИИ. В сущности, это был мой день рождения.
Второй ролик. Сёрфер.
Запрос: Сгенерируй видео, где я катаюсь на сёрфборде под мостом Золотые Врата.
Джинсовый костюм. Без обуви. Странный выбор для водных процедур. Ракурс камеры напоминает GoPro, приклеенную к доске. Текстура реалистичная. Логика — никакая.
От этой технологии сильнее страдают женщины. Дипфейки, созданные без согласия людей, — это настоящий ночной кошмар. Google заявляет, что безопасность для них на первом месте.
«Мы пытаемся предотвратить вред», — сказала мне Николь Бречтова из DeepMind. «Но мы не блокируем безобидные вещи».
Баланс? Возможно.
Заикание очевидно. Ошибки вылезут наружу. И всё же.
Остается чувство. Эти ролики кажутся более реальными, чем моя последняя голосовая почта или видео со мной в баре в пятницу. Аватар — это не более красивая или улучшенная версия. Нет.
Это просто я. Но всегда готовый. В любом месте. Всегда выступающий.





















