Microsoft entra nella storia: il riconoscimento vocale è quasi umano

Microsoft entra nella storia: arriva il riconoscimento vocale è quasi umano

A Redmond hanno raggiunto un risultato eccezionale: per la prima volta un computer è in grado di riconoscere le parole di una conversazione con una precisione quasi umana.

Microsoft ha messo a punto un sistema per il riconoscimento vocale quasi perfetto.

Ne è passata di acqua sotto i ponti da quando la Darpa, agli inizi degli anni ’70, iniziava le prime sperimentazioni sulla tecnica del riconoscimento vocale.

Da allora molti si sono cimentati nell’impresa, ma nessuno ha mai raggiunto i risultati portati a casa da Microsoft.

Il sistema sviluppato a Redmond sarà utilizzato da molti servizi incluso Xbox e Cortana. Per ottenere questo straordinario risultato è stato fatto un uso massiccio di reti neurali convoluzionali e LSTM (Long short-term memory).

La velocità di queste reti è stata aumentata grazie all’utilizzo di una serie di computer con una GPU realizzata per lo scopo. Microsoft si è servito del Computational Network Toolkit per il deep learning che il team di ricerca ha distribuito su GitHub con licenza open source.

Che cosa significa riconoscimento vocale “quasi umano”? Di certo non che riesca a riconoscere perfettamente ogni parola.

Mancano ancora altri test per arrivare a questo. Di sicuro però il sistema è in gradi di capire molte parole pronunciate dall’utente. Prossimante, molto probabilmente, riuscirà a capirle tutte senza tentennamenti.