La tecnología de reconocimiento de audio es una gran aliada en las funciones de Accesibilidad, ya que ayuda a las personas con problemas de audición o de vista a estar atentas a por ejemplo cuando suena un semáforo que se pone en verde para los peatones, el timbre de la casa o animales como un perro.
Pero su uso va mucho más allá. Y Xiaomi puede presumir de contar hoy por hoy como líder a nivel mundial gracias a su algoritmo de reconocimiento de sonido.
AudioSet-2M
El conjunto de datos AudioSet es una colección hecha por Google a gran escala de clips de sonido de 10 segundos etiquetados por humanos y extraídos de vídeos de YouTube. Hay, literalmente, millones de audios de coches, animales, instrumentos musicales, discursos, música, tiempo, clima, deportes, etc.
Google tiene dividido el conjunto de datos AudioSet en tres partes: los dos primeros subconjuntos, conocidos colectivamente como "AudioSet-2M", se han estado usando con fines de formación de distintas tecnologías de reconocimiento. Y una de ellas ha sido la tecnología de reconocimiento de sonidos de Xiaomi, cuyo algoritmo fue entrenado usando este conjunto de datos.
En la más reciente prueba sonora, el algoritmo de Xiaomi superó el umbral de 50 mAP de puntuación, lo que le ha valido a la compañía establecer un nuevo estándar en la tecnología de etiquetado de audio, a la par que un avance significativo en el ámbito de las tareas de etiquetado de audio.
Xiaomi, líder global en tecnología de reconocimiento de audio
La pregunta que mucha gente se hará es que cuáles son las aplicaciones prácticas de esto. La respuesta es que muchísimas: no sólo hablamos de la Accesibilidad mejorada para personas con problemas auditivos e impedimentos visuales en prácticamente todos los dispositivos inteligentes de Xiaomi, mejorando la experiencia general del usuario. Hay más:
El algoritmo destaca en el reconocimiento de diversos sonidos ambientales, como llantos de bebés, ruidos de animales, motores de coches, etc., y puede representar estos sonidos de diferentes formas, como texto.
Además, los robots de Xiaomi se benefician enormemente de esta tecnología de algoritmos:
El robot humanoide CyberOne puede reconocer 85 tipos de sonidos ambientales y percibir una amplia gama de emociones humanas a través de la detección auditiva.
El robot cuadrúpedo biomimético de segunda generación, CyberDog 2, puede identificar 38 tipos de sonidos ambientales, lo que mejora aún más su capacidad de respuesta dinámica.
Vía | My Drivers / Gizmochina
En Mundo Xiaomi | El perro robótico de Xiaomi evoluciona: Mira el CyberDog 2, la versión entrenada por IA que se parece a un Dóberman