El reconocimiento por voz es uno de los campos más interesantes en el ámbito de la tecnología. Todos hemos soñado con hablar a nuestro ordenador o smartphone y evitar escribir algo. Esto ha supuesto que los asistentes virtuales hayan potenciado el reconocimiento por voz. Microsoft tiene por objetivo ser el más preciso de todos.
El reconocimiento por voz de Microsoft supera al ser humano
Desde hace unos años Microsoft se ha centrado en mejorar la precisión de su reconocimiento por voz. Hoy desde Redmond han anunciado que han alcanzado un nuevo hito on una Tasa de Palabras Errónea (WER) del 5,1%. Eso ha supuesto reducir su anterior cifra de un 5,9%.
Sorprende ver el avance desde hace un año, que estaba en un 6,3% y ya ha conseguido reducir, en tan solo un año un 12% su propia marca. La relevancia de esta nueva marca supone que el reconocimiento por voz de Microsoft es tan preciso como el ser humano, algo que lleva persiguiendo desde hace 25 años.
Desde Redmond han indicado como han conseguido reducir la tasa de error haciendo uso de una red neural circunvolucional y bidireccional. Los ingenieros de Microsoft también han trabajado en mejorar su red neural de modelos acústicos y de lenguaje mejorando la tasa de error. Otro de los causantes ha sido la nube, esta ha permitido un proceso de entrenamiento mayor para los modelos acústicos y de lenguaje.
El reconocimiento de voz de Microsoft se emplea en múltiples servicios de la compañía como Windows, Cortana, Office, Cognitive Services y, nos beneficiaremos de ello durante los próximos meses.