Es ist warm. Eigentlich warm, was im Dolores Park selten vorkommt. Ich stehe da. Ein Dinosaurier ist prähistorisch und geduldig. Ich singe dazu. Ein Cupcake erscheint. Rosa Kerze. Zaubertrick oder Panne? Wenn ich das Wachs ausblase, sieht das CGI-Biest zufrieden aus. Fast selbstgefällig.
Dieser Mann, der singt, sieht aus wie ich. Klingt größtenteils nach mir. Aber ich bin es nicht.
Dies kommt von Google Gemini. Neue Avatar-Funktion. Es klont Ihre Stimme und Ihr Gesicht und fügt dann den digitalen Doppelgänger in ein Video ein. Es basiert auf Omni, ihrem neuen Videomodell. Hierfür benötigen Sie das 20-Dollar-Pro-Abonnement.
Ich habe die Obergrenze erreicht. Schnell. Die Nutzung wird alle fünf Stunden zurückgesetzt. Ich habe Fragen gestellt, zwei Clips verbrannt und bin dann rausgeschmissen worden. „Warte“, sagte der Bot. Unhöflich.
Zwei Clips. Dinosaurier. Surfer unter der Golden Gate Bridge. Beeindruckend. Unheimlich. Auch erschreckend. Durcheinandergebrachte Logik. Outfits, die keinen Sinn ergeben. Aber das Gesicht … vergrößert, die Zähne sind leicht falsch. Aber Kinnfett? Das ist da. Reece 2. OpenAI hatte Sora. Sie lassen zu, dass Menschen auch andere klonen. Google nicht. Erwachsene können sich nur selbst klonen. Zur Zeit.
Fünf Minuten genügen. Helles Zimmer. Telefonkamera. Lesen Sie zweistellige Zahlen laut vor. Schauen Sie richtig. Nach links schwenken. Erledigt. Seien Sie vorsichtig mit Ihrem Outfit. Die Jeansjacke, die du liebst, könnte zu deinem KI-Gefängnis werden.
Schauen wir uns das Geburtstagsvideo an.
Eingabeaufforderung: Erstellen Sie ein Video, in dem ich einem alten Dinosaurier am Dolores Park Hill alles Gute zum Geburtstag singe.
Es beginnt mit einer Pause. Ein tausendjähriges Zögern. Der Hintergrund ist erschreckend genau. Kein allgemeiner Park. Das ist dieser Park. Palmen. Der Salesforce-Tower steht vor der Tür. Google kartiert die Welt, erinnerst du dich? Sie kennen die Geometrie von Hügeln.
Dann der Gesang. Besserer Bariton als mein eigener. Weniger wackelig. Hände hüpfen wie ein Minidirigent. Dann kommt „to“. Es stottert. Auf Weitwinkel schneiden. Chaos. Cupcake verschwindet? Erscheint? Ich atme Rauch aus? Eine Kerze ausblasen? Unhöfliche KI. Im Grunde war es mein Geburtstag.
Der zweite Clip. Surfer.
Eingabeaufforderung: Erstellen Sie ein Video von mir, wie ich unter der Golden Gate Bridge surfe.
Jeansanzug. Keine Schuhe. Seltsame Wahl für Wasser. Der Kamerawinkel fühlt sich an wie bei einer GoPro, die auf das Board geklebt ist. Realistische Textur. Schlechte Logik.
Frauen leiden stärker unter dieser Technologie. Nicht einvernehmliche Deepfakes sind ein wahrer Albtraum. Google sagt, dass Sicherheit an erster Stelle steht.
„Wir versuchen, Schaden zu verhindern“, sagte mir Nicole Brichtova von DeepMind. „Aber wir blockieren keine harmlosen Dinge.“
Gleichgewicht? Vielleicht.
Das Stottern ist offensichtlich. Es tauchen Fehler auf. Noch.
Das Gefühl bleibt. Diese Clips fühlen sich realer an als meine letzte Voicemail. Oder ein Video von mir in einer Bar am Freitag. Der Avatar ist keine heißere, bessere Version. Nein.
Das bin nur ich. Aber immer bereit. Überall. Immer performend.
