skip to main | skip to sidebar
20 commenti

Voci simulate con Lyrebird

Quelle che potete sentire qui su Lyrebird.ai o qui sotto non sono le classiche voci-parodia di personaggi famosi (in questo caso Barack Obama, Donald Trump e Hillary Clinton), generate rimontando ad arte dei pezzi di loro frasi effettivamente pronunciate: sono completamente sintetiche. A Lyrebird basta anche un solo minuto di voce registrata per creare una copia che imita tutte le caratteristiche identificative di una persona. Da questa copia è possibile generare qualunque frase.


Le implicazioni di autenticazione e di identità di un servizio del genere sono impressionanti. Di questo passo non potremo più fidarci di una voce sentita al telefono, per esempio, i sistemi di autenticazione basati sul riconoscimento del timbro di voce saranno inattendibili e potremmo trovarci presto a conversare con dei chatbot che fingono di essere la persona con la quale vorremmo parlare (Be Right Back di Black Mirror si avvera sempre più, insomma); per contro, i contratti fatti per telefono potrebbero non essere più legali (il venditore potrebbe aver creato la mia voce) e potremmo anche sentire i film doppiati con le voci degli attori originali che miracolosamente parlano la nostra lingua.
Invia un commento
I commenti non appaiono subito, devono essere tutti approvati da un moderatore. Lo so, è scomodo, ma è necessario per tenere lontani scocciatori, spammer, troll e stupidi: siate civili e verrete pubblicati qualunque sia la vostra opinione; gli incivili di qualsiasi orientamento non verranno pubblicati, se non per mostrare il loro squallore.
Inviando un commento date il vostro consenso alla sua pubblicazione, qui o altrove.
Maggiori informazioni riguardanti regole e utilizzo dei commenti sono reperibili nella sezione apposita.
NOTA BENE. L'area sottostante per l'invio dei commenti non è contenuta in questa pagina ma è un iframe, cioè una finestra su una pagina di Blogger esterna a questo blog. Ciò significa che dovete assicurarvi che non venga bloccata da estensioni del vostro browser (tipo quelle che eliminano le pubblicità) e/o da altri programmi di protezione antimalware (tipo Kaspersky). Inoltre è necessario che sia permesso accettare i cookie da terze parti (informativa sulla privacy a riguardo).
Commenti
Commenti (20)
Trovo incredibile (o meglio straordinario) che basti poco al programma per ricreare una voce, ma tutto il resto c'è già da tempo.
Ad esempio il software "vocaloid" è un "sintetizzatore" vocale (o meglio un set in quanto sono disponibili più voci) sviluppato per creare canzoni. Ogni voce è stata creata sulla base di voci reali.
Il successo di questo software è stato tale che nel suo paese d'origine nei negozi di dischi sono in vendita album creati con tale software.
Sono stati fatti concerti "live".
Per dare une sempio della versatilità del programma:
https://www.youtube.com/watch?v=vsftx8UDkmE

per il cocnerto cercate su you tube "vocaloid -concert - shibuya"

unico neo... è in giapponese.
La cosa è abbastanza inquietante, ma è anche vero che visto i progressi della tecnologia era chiaro che prima o poi ci si sarebbe arrivati.
Chissà da un punto di vista del copyright come funzionerà, chiunque potrà girare un video indipendente e farselo doppiare da Amendola o da George Clooney...
Mi sono sempre chiesto come funzioni anche oggi il copyright sulla voce, se sento una pubblicità dove chiaramente c'è una voce famosa ma questa persona non viene mai fatta vedere (tipo L'amaro Molinari con la voce Mourinho), chi mi dice che sia davvero lui ad aver parlato? Non potrebbe semplicemente essere uno con la voce che gli somiglia? E in quel caso avrebbero dovuto dare dei soldi a Mourinho? E se invece fosse un imitatore? In quel caso i soldi glieli avrebbero dovuti dare?
Oh my... Se qualcuno crede a qualsiasi email o video farlocco, immagino i danni generati dal phishing telefonico del tipo "sono mamma, mandami dei soldi".
Era uno dei trucchi preferiti da Evaristo.

https://www.youtube.com/watch?v=MT_u9Rurrqg (Attenzione, un tizio viene pugnalato a morte, e poco dopo 1:20 se ne vede il cadavere.)
@ST
Non so se ho sbagliato qualcosa io, ma con la tua chiave di ricerca non sono riuscito a trovare veri concerti di vocaloid.
Per dire, questi sono concerti:
https://www.youtube.com/watch?v=jhl5afLEKdo
https://www.youtube.com/watch?v=GOano9x9cBY

dunque,

ehm,

...

OK, lo ammetto, al concerto del secondo video c'ero anch'io (munito di bacchetta luminosa d'ordinanza)...
Argh mi vengono in mente le telefonate che tutti noi riceviamo nelle quali ci propongono nuovi contratti telefonici o di qualsivoglia altro prodotto. Se non sbaglio basta che diamo il nostro assenso a una domanda esplicita al telefono per abbonarci o comunque per impegnarci in qualcosa.
Con voci digitali ben fatte siamo tutti spacciati. Basta una prima telefonata per carpire i dati necessari e la seconda, mai davvero fatta, sara' realizzata in digitale e ovviamente in quella approveremo qualsiasi richiesta.
Ci aspetta un nuovo medioevo in cui tutti saremo abbonati a duecento diversi fornitori dello stesso servizio.
Adesso ogni volta che mi telefona qualcuno che conosco bene dovro' fargli il test di Turing ed essere preso per deficiente da mia mamma quando e' proprio lei a chiamarmi...
Io avevo visto questo video della Adobe:

https://www.youtube.com/watch?v=I3l4XLZ59iw
"grazie" al digitale, ormai la mattina dovremo ripeterci come un mantra "ricordati che tutto quello che vedrai e sentirai oggi sarà taroccato"...
Giusto in tema di AI, qui http://www.giovediscienza.it/modules/conferenze/article.php?storyid=156 c'è una conferenza interessante sui prossimi sviluppi e su come si sta procedendo oggi. Tra l'altro c'è proprio una demo di un traduttore artificiale che usa la voce dell'uomo che parla (se non ricordo male è una demo di MS).
i contratti fatti per telefono potrebbero non essere più legali (il venditore potrebbe aver creato la mia voce)

Il che non sarebbe affatto un male, perché i contratti falsi li fanno lo stesso, non so in Svizzera, ma in Italia basta che ti facciano leggere i numeri sulla bolletta per poterti cambiare operatore (ad esempio si spacciano per il tuo fornitore, ti dicono che l'ultima bolletta non risulta pagata e ti chiedono di leggerla per poter fare una verifica - FALSO - perché il tuo operatore può vedere TUTTO senza sapere nome e cognome, non è dalla bolletta che si vede se è stata pagata).

Tra l'altro un po' di tempo fa dicevano di non dire mai di "si" proprio perché potevano "rimontarti" la voce incollando il tuo si alle domande di loro gradimento, però non ho mai capito se fosse vero o se per caso fosse una bufala. :-/
Ad un orecchio allenato, le voci di Lyrebird risultano comunque sintetiche: a parte il "sapore" metallico, non ci sono interruzioni per il respiro.
Insomma è un pò presto per chiamare la flotta USA e, con la voce di Trump, ordinare l'abbandono dei vascelli ;)
Un possibile risvolto utile per quelle lingue con pochi parlanti per creare corsi con voci credibili e non robe alla Balabolka, programma che girava qualche anno fa.
Dopo una veloce e superficiale riflessione direi che non mi pare ce ne sia bisogno.

Intendo dire, se una diceria su un personaggio famoso si attacca bene, i pettegoli non chiedono neanche da quali giornali è stata appresa.

Buh, vedo che tanti si preoccupano della possibilità che una voce sintetica venga utilizzata per ottenere credito o autorizzazioni. E fanno bene, ma trovo più preoccupante il fatto che alcuni potrebbero negare di aver detto qualcosa e dar la colpa a simili programmi.

Prima di allarmarsi, ricordiamoci che in diatribe del tipo: "Noo, io non ho mai detto [...] ; ti ricordi male ; "HAHA! devo ammettere che è un'ottima imitazione"; (Rivolto agli altri presenti)"ma vi sembra possibile?"

I venditori di aspirapolveri l'han sempre avuta vinta. Anche ai tempi del grammofono.
@Puffolotti beh in verita' negare quanto detto il giorno prima e' un classicone ormai di tutti i nostri politici e suppongo anche di quelli esteri.
Mi ha sempre sorpreso notare come quasi tutti i TG quando uno dichiara una cosa totalmente contraria a quanto detto (nel TG!) il giorno prima... non mostri la registrazione.
Insomma, ok avere ognuno le sue idee politiche (e ci sta) ma se uno mente senza esitazione deve essere chiaro, poi chi lo preferisce ancora prosegua pure.
Sigh.
Roberto.
potremmo anche sentire i film doppiati con le voci degli attori originali che miracolosamente parlano la nostra lingua.
Questo non so se e' un bene, tipo Ferruccio Amendola ha dato un grandissimo spessore a dei personaggi la cui voce originale sarebbe stata diciamo "discutibile"...
*potenzialmente* inquietante. Le voci dell'esempio sono piuttosto acerbe rispetto a quanto immaginavo dalla lettura dell'articolo.
Sicuramente miglioreranno in un tempo relativamente breve: per ora lo trovo un risultato tecnicamente impressionante ma ben lontano dall'essere verosimile.
@Ataru
un link è il concerto, l'altro è a "alice of human sacrigfice" tutto il brano è stato fatto con il software, l'ho messo come esempio della versatilità di quel programam che riesce a dare determinati toni e a plasmare molto bene una voce sintetica, e tutt'altro che metallica
Anche sentire la voce di un proprio caro defunto è una inquietante possibilità.