ES 202 050-2002
Procesamiento del Habla@ Transmisión y Aspectos de Calidad (STQ); Reconocimiento de voz distribuido; Algoritmo avanzado de extracción de funciones de front-end; Algoritmos de compresión (V1.1.1)

Estándar No.
ES 202 050-2002
Fecha de publicación
2002
Organización
ETSI - European Telecommunications Standards Institute
Estado
 2014-04
Remplazado por
ES 202 050-2003
Ultima versión
ES 202 050-2007
Alcance
"El presente documento especifica algoritmos para la extracción avanzada de características frontales y su transmisión que forman parte de un sistema de reconocimiento de voz distribuido. La especificación cubre los siguientes componentes:  ——el algoritmo para la extracción avanzada de características frontales para crear parámetros Mel-Cepstrum ;  ——el algoritmo para comprimir estas características para proporcionar una velocidad de transmisión de datos más baja;  ——el formateo de estas características con protección contra errores en un flujo de bits para su transmisión;  ——la decodificación del flujo de bits para generar las características avanzadas de interfaz en un receptor junto con los algoritmos asociados para la mitigación de errores de canal. El presente documento no cubre los algoritmos de reconocimiento de voz "back-end" que hacen uso de las funciones avanzadas de front-end DSR recibidas. Los algoritmos se definen en forma matemática o como diagramas de flujo. El software que implementa estos algoritmos escrito en el lenguaje de programación 'C' está contenido en el archivo ZIP es~202050v010101pO.zip que acompaña al presente documento. Las pruebas de conformidad no se especifican como parte de la norma. El rendimiento de reconocimiento de las implementaciones propietarias del estándar se puede comparar con los obtenidos utilizando el código 'C' de referencia en bases de datos de voz apropiadas. Se prevé que el flujo de bits DSR se utilizará como carga útil en otros protocolos de nivel superior cuando se implemente en sistemas específicos que admitan aplicaciones DSR. En particular@ para la transmisión de datos en paquetes@, se prevé que la definición de carga útil IETF AVT RTP DSR (ver bibliografía) se utilizará para transportar características DSR utilizando el formato de par de tramas descrito en la cláusula 7. El estándar DSR avanzado está diseñado para su uso con discontinuos. transmisión y para soportar la transmisión de información de actividad de voz. El Anexo A describe un algoritmo VAD que se recomienda para su uso junto con el estándar Advanced DSR@; sin embargo, no forma parte del presente documento y los fabricantes pueden optar por utilizar un algoritmo VAD alternativo.

ES 202 050-2002 Historia

  • 2007 ES 202 050-2007 Procesamiento del Habla@ Transmisión y Aspectos de Calidad (STQ); Reconocimiento de voz distribuido; Algoritmo avanzado de extracción de funciones de front-end; Algoritmos de compresión (V1.1.5; Incluye Disquete)
  • 2005 ES 202 050-2005 Procesamiento del Habla@ Transmisión y Aspectos de Calidad (STQ); Reconocimiento de voz distribuido; Algoritmo avanzado de extracción de funciones de front-end; Algoritmos de compresión (V1.1.4)
  • 2003 ES 202 050-2003 Procesamiento del Habla@ Transmisión y Aspectos de Calidad (STQ); Reconocimiento de voz distribuido; Algoritmo avanzado de extracción de funciones de front-end; Algoritmos de compresión (V1.1.3; contiene disquete)
  • 2002 ES 202 050-2002 Procesamiento del Habla@ Transmisión y Aspectos de Calidad (STQ); Reconocimiento de voz distribuido; Algoritmo avanzado de extracción de funciones de front-end; Algoritmos de compresión (V1.1.1)



© 2023 Reservados todos los derechos.