Future Trends & Tech

Facebook, grandi passi avanti nei meccanismi di riconoscimento vocale

Facebook assistente vocale

Facebook ha annunciato una svolta nei meccanismi di riconoscimento vocale. In futuro la piattaforma comprenderà anche i dialetti

Il riconoscimento vocale è un meccanismo fondamentale nei processi di intelligenza artificiale. Questa tecnologia è ormai diventata base di molti degli strumenti che usiamo comunemente: degli assistenti vocali sui nostri telefoni; le interfacce delle nostre auto; degli altoparlanti intelligenti nelle nostre case e via dicendo.

Nonostante tutto però, il concetto di “riconoscimento vocale” è ancora un settore work in progress.

Poche ora fa, però, Facebook ha annunciato un importante passo avanti nel modo in cui “addestra” i sistemi per imparare nuove lingue. L’azienda ha affermato di aver sviluppato un metodo innovativo per creare strumenti di riconoscimento vocale che non richiedono dati trascritti.

Secondo la società di Mark Zuckerberg, infatti, sembra che questo nuovo sistema possa liberare gli assistenti vocali dalla loro dipendenza dall’input di sintesi vocale.

Come sappiamo, questo processo, coinvolge moltissimi persone che sono “costrette” ad ascoltare e trascrivere ore e ore di audio in tutte le lingue. Sembra però che la nuova invenzione di Facebook sia in grado di imparare in automatico dall’audio e senza più il bisogno di un testo a supporto.

Come funziona il riconoscimento vocale di Facebook?

Questo nuovo modello si basa essenzialmente su un sistema di feedback con un Generative Adversarial Network (GAN) composto da un “generatore” e un “discriminatore”. Il primo “crea” rappresentazioni di schemi vocali che sembrano senza senso fino a quando non vengono fatti passare attraverso il “discriminatore” di cui sopra” che funziona come un traduttore. Al contempo però FB inserisce nel processo anche un testo scritto dall’essere umano per aiutare le varie parti del sistema a distinguere i testi computerizzati da quelli umani. Le operazioni vanno avanti fino a che il testo in uscita non corrisponde a quello reale.

Le prime prove sul campo hanno permesso al team di Facebook di creare un sistema di riconoscimento vocale senza aver bisogno dei dati pre-annotati dall’uomo. Dai primi test sembra che il modello stia già dando risultati più che positivi.

Al momento gli sviluppatori sono arrivati a un 63% in meno di errori commessi rispetto ai modelli creati qualche anno fa. Un risultato più che valido se calcoliamo il pochissimo tempo in cui è stato realizzato.

L’obiettivo della società è quello di inaugurare al più presto sistemi di riconoscimento vocale per più lingue e dialetti in tutto il mondo; tutto questo nell’ottica di un utilizzo ancor più democratico della tecnologia. Chiaramente Facebook avrà un grande vantaggio da questa “rivoluzione” : riuscire a portare ancora più utenti all’interno della piattaforma. Siccome poi queste persone non si trovano tutte negli Stati Uniti, l’obiettivo a lungo termine è quello di connettere miliardi di persone “semplicemente” attraverso la loro lingua preferita.

Facebook, grandi passi avanti nei meccanismi di riconoscimento vocale

Contatti

SpremuteDigitali.com è un marchio proprietario di Seedble S.r.l. Seedble è una PMI innovativa parte del gruppo Symphonie Prime. Dal 2014 disegniamo e creiamo organizzazioni future-proof in grado di innovare, evolversi e adattarsi a tutti gli scenari socio-economici.

SEDE LEGALE E OPERATIVA:

Via Prisciano, 72 - 00136 Roma (RM)

ALTRE SEDI:

Via Canova 15, 6900 Lugano (CH)

Articolo aggiunto ai tuoi preferiti

.

0:00:00

0:00:00

Condividi questo contenuto su: