Si può creare un clone di sé stessi grazie all’intelligenza artificiale? Una giornalista del Wall Street Journal, Joanna Stern, ci ha provato. Il clone è riuscito senza fatica a entrare nel sistema di gestione della carta di credito grazie al riconoscimento vocale e – superando le aspettative della columnist – ha convinto anche diversi suoi parenti, che parlando al telefono erano convinti di interloquire con la vera Stern. «Dato che lavoro molto con audio e video, ho pensato di provare a vedere se l’AI mi avrebbe aiutato a diventare più produttiva», racconta la giornalista nel resoconto della propria esperienza sul quotidiano statunitense. Affidandosi a un software chiamato Synthesia, ha creato il proprio avatar virtuale. Sono servite alcune ore di sample vocali, qualche clip del proprio mezzobusto e una settimana di tempo per ottenere la Stern virtuale.

Videochiamate e TikTok

Peccato che ai più fosse molto chiaro che non si trattava di un essere umano. La giornalista ha provato a usare l’avatar per presenziare alle videochiamate al posto suo. Ma i colleghi non ci hanno messo molto a rendersi conto che i movimenti erano rigidi, monotoni, e che le mani non gesticolavano in nessun modo. È andata un po’ meglio su TikTok, «dove gli utenti hanno la soglia dell’attenzione di un pesce rosso», commenta Stern. La giornalista ha chiesto a ChatGPT di scrivere un video e ha poi dato il dialogo creato dal bot in pasto al proprio avatar, che l’ha recitato pochi minuti dopo. Per alcuni la differenza è passata inosservata, ma in tanti hanno fatto notare nei commenti che c’era qualcosa che non andava, puntando il dito proprio contro l’intelligenza artificiale.

La sintesi vocale che ha ingannato i genitori, la sorella e la banca

Stern si è quindi affidata a un altro software, di sola sintesi vocale: ElevenLabs. In questo caso i risultati sono stati migliori in termini di impersonificazione. Solo dopo diversi minuti di chiamata, la sorella della giornalista si è resa conto che non era al telefono con lei ma con il suo avatar, che Stern comandava scrivendo cosa dire su ChatGPT. E a tradire l’AI nella conversazione con lei e i genitori non sono stati dei veri difetti della voce, bensì la mancanza di pause, che dopo un po’ è apparsa innaturale. L’AI non ha bisogno di respirare, e quindi, a meno che non glielo si dica, non si ferma. Ma ciò non ha impedito al sistema di riconoscimento vocale della banca della giornalista di autorizzare l’avatar a effettuare ogni modifica consentita agli esseri umani per via telefonica.

Il pericolo falsi e come evitarlo

Un esperimento che la giornalista ha commentato così: «Certo, il mio clone video chiaramente non sono io. Ma se nemmeno mia sorella e i miei genitori riescono a riconoscere che la mia voce è creata dall’AI, come posso aspettarmi che ci riescano gli altri?». Il messaggio sottintende una preoccupazione che diverse aziende che operano nel campo percepiscono. E alcune stanno cercando di porvi rimedio. Adobe, ad esempio, ha organizzato un’iniziativa per aggiungere al materiale audiovisivo i dati su come è stato creato, in modo che, anche online, sia possibile capire se si tratta di qualcosa generato dagli esseri umani o meno. E Synthesia – il software usato da Stern per creare il proprio avatar – ha già aderito.

Continua a leggere su Open

Leggi anche: