Compartir en Facebook
Compartir en Twitter

Leemos en WinBeta que el proyecto futurístico de Microsoft de nombre Oxford parece ir viento en popa. Los chicos de Redmond acaban de lanzar una vista previa de su máquina de reconocimiento de voz y API de vídeo, para todos aquellos que quieras usarla. ¿Quieres echar un vistazo al futuro?

El futuro es una realidad hoy

El proyecto Oxford de Microsoft trata de sacar el máximo partido a la Inteligencia Articial, de forma que podamos hablar hoy de una realidad futurística sacada de las más grandes películas de ficción. Todo esto es mucho más amplio, el proyecto Oxford de Microsoft representa lo que esta empresa piensa que será el futuro de la computación personal. Ordenadores que sean capaces de escucharnos, entendernos y hablarnos como personas.

Nuestro objetivo con el reconocimiento de voz es ayudar a los desarrolladores a crear mecanismos de autenticación inteligentes, capaces de encontrar un equilibrio entre la comodidad y el fraude. Lograr ese equilibrio no es tarea fácil.

Para lograr este equilibrio se necesitan tres datos primordiales:

  • Algo que tú sabes (contraseña o PIN).
  • Algo que tú tienes (un teclado, un dispositivo móvil, una tarjeta de crédito).
  • Algo que es parte de ti (tu voz, tu huella dactilar, tu cara).

La API de reconocimiento de voz de Microsoft también hace uso de algoritmos que ayudan a reconocer las distintas voces gracias a los flujos de audio que estas producen. Estos nuevos componentes se denominan “Speaker Verification and Speaker Identification”.

  • “Speaker Verification” puede verificar de forma automática y autentificar a los usuarios de gracias a la voz o el habla. Está estrechamente relacionado con escenarios de autenticación y a menudo se asocia con una frase en concreto. Por lo tanto, se debe de elegir una “frase secreta”, algo que el ordenador pueda reconocer como contraseña.
  • “Speaker Identification” puede reconocerte, a ti, entre el resto de personas que podrían decir esa misma frase, por lo que no solo reconoce las palabras, sino quien lo dice. Esto es realmente importante.

Microsoft se está preparando para el futuro de la computación, entró tarde en el boom de los smartphones, pero no quiere dejar pasar el siguiente tren, quieren ser los ingenieros de dicho tren. Mirar más allá de la revolución móvil para crear la próxima generación de dispositivos. Podéis leer más en el siguiente enlace.

  • Rubén Gracia

    Léase con voz de Bart Simpson: Moooola!

    • Victor Gomez ⚡

      Hablando de Bart Simpson hace unos días me puse a pensar en que Microsoft debería lanzar una versión o alguna promoción que en vez de la voz de cortana sea la de Bart Simpson. Seria genial y esto causaría una pegada enorme y así se atraen a mas usuarios. Ojala algo asi pase, ojala y que siri no se le vaya delante.

      • ZFisher

        Como hizo alguna vez TomTom con sus GPS, que se podía comprar paquetes con las voces de personajes de star wars.

        • Victor Gomez ⚡

          También tengo otra idea y es que cuando le preguntes por ejemplo la biografía de Bill Gates sea este mismo quien te conteste con su voz y diciéndote una breve biografía sobre el y cosas asi, la biografía de barack Obama con la voz de obama, la de Will Smith con coz de Will Smith etc etc

  • Roberto

    Bien bien.. Mientras tanto en Lumia….

    • Rodrigo Hernández Santillán

      Que tienen los Lumia?

    • Alejandro

      Ein???

  • Lorenzo Jiménez

    Me explicáis la foto, ¿que tiene que ver el actor Joaquin Phoenix en la nota?

    • Alejandro

      Es una referencia a la película HER creo que era, donde el actor se relacionaba con una IA ;)

      • Pablo Guijarro Huesca

        Minipunto Insider para Alejandro, era fácil!

        • Lorenzo Jiménez

          Todo bloguero no puede asumir que su audiencia sabe especialmente de algo ajeno al blog. Una humilde opinión.

          • Marc

            La imagen no es necesaria para comprender el artículo, así que no veo el problema.

          • Lorenzo Jiménez

            Si el autor quiso ponerla fue por algo. En la comunicación hay un emisor que quiere comunicar algo y un receptor que lo recibe. El comunicador quiere que sea bien recibido y entendido. Yo no sabía que en Microsoft Insider había “easter eggs” en los artículos. ¡Ojala den premios!

          • Marc

            Según tu teoría toda comunicació pública debería basarse en el mínimo común denominador, en el receptor menos competente. Espero que ese mundo nunca llegue. :-)

  • Nahuel Gómez Castro

    Emm igualmente sube un poquitin tarde, Nuance y Speaktoit ya llevan en esto desde hace tiempo

  • Marco Alvaron

    Bueno esta demostrado que si Microsoft no puede competir con alguna empresa que le lleva la delantera en algo, simplemente lo compra y se soluciono sus problemas, asi que esperemos sus prontas adquisiciones.