ITU-T P.863-2018
Predicción de la calidad auditiva objetiva perceptual (Comisión de Estudio 12)

Estándar No.
ITU-T P.863-2018
Fecha de publicación
2018
Organización
ITU-T - International Telecommunication Union/ITU Telcommunication Sector
Alcance
Esta Recomendación1 define un algoritmo único para evaluar la calidad de la voz de los sistemas telefónicos actuales y futuros cercanos que utilizan una amplia variedad de tecnologías de codificación@, transporte y mejora de la voz. Sobre la base de los resultados de referencia presentados en los estudios del UIT-T@, en los Cuadros 1 a 4 se ofrece una visión general de los factores de prueba@ tecnologías y aplicaciones de codificación a las que se aplica esta Recomendación. El Cuadro 1 presenta los factores y aplicaciones incluidos en la especificación de requisitos y que se utilizaron en la fase de selección del algoritmo ITU-T P.863. Cabe señalar que el rendimiento del algoritmo UIT-T P.863 bajo cada condición individual del Cuadro 1 no se refleja en este cuadro. El Cuadro 2 presenta una lista de condiciones para las cuales no está previsto utilizar esta Recomendación. El Cuadro 3 presenta variables de prueba para las que se necesita más investigación @ o para las cuales ITU-T P.863 está sujeta a reclamaciones por proporcionar predicciones inexactas cuando se utiliza junto con ellas. Por último, en el Cuadro 4 se enumeran factores @ tecnologías y aplicaciones para las cuales el algoritmo UIT-T P.863 no ha sido validado actualmente. Tenga en cuenta que el algoritmo ITU-T P.863 no se puede utilizar para reemplazar las pruebas subjetivas. También cabe señalar que el algoritmo ITU-T P.863 no proporciona una evaluación exhaustiva de la calidad de la transmisión. Solo mide los efectos de la distorsión del habla unidireccional y el ruido en la calidad del habla. Los efectos del retardo @ efecto local @ eco @ y otras degradaciones relacionadas con la interacción bidireccional (por ejemplo @ clipper central) no se reflejan en las puntuaciones ITU-T P.863. Por lo tanto@ es posible tener puntuaciones altas de ITU-T P.863@ pero una mala calidad de conversación general. Cabe señalar que ITU-T P.863 es más insensible a niveles de ruido muy bajos en el modo de banda completa que en el modo de banda estrecha. El conjunto de pruebas de ITU-T P.863 cubre los siguientes idiomas: inglés americano@ inglés británico@ chino (mandarín)@ checo@ holandés@ francés@ alemán@ italiano@ japonés@ sueco@ alemán suizo. Los experimentos subjetivos se llevaron a cabo en laboratorios de pruebas subjetivas ubicados en estos respectivos países. ITU-T P.863 es la tecnología de prueba de calidad de voz de próxima generación para redes fijas @ móviles y basadas en IP. Se ha seleccionado ITU-T P.863 para formar el nuevo estándar de prueba de calidad de voz de ITU-T. Esta Recomendación fue desarrollada entre 2006 y 2010 en un concurso realizado por ITU-T@ con el fin de definir una actualización tecnológica para [b-ITU-T P.862]. El propósito del modelo objetivo ITU-T P.863 es predecir la calidad general de la voz auditiva en banda estrecha (300 a 3 400 Hz) @ banda ancha (50 a 7 000 Hz) @ banda súper ancha (50 a 14 000 Hz) y banda completa (20 a 20 000 Hz) escenarios de telecomunicaciones percibidos por el usuario. Esto incluye todos los componentes de procesamiento de voz que normalmente se consideran para telecomunicaciones en condiciones limpias y ruidosas. El término "calidad de la voz en la escucha" significa la calidad general de la voz tal como la perciben y califican los seres humanos en un experimento de clasificación de categorías absolutas de acuerdo con [UIT-T P.800] o [UIT-T P.830]. En modo de banda completa, las puntuaciones de ITU-T P.863 se predicen en una escala de banda completa MOS ACR; Los detalles sobre el diseño del experimento se proporcionan en el Apéndice II. En el modo de banda estrecha, las puntuaciones de ITU-T P.863 se predicen en una escala de banda estrecha MOS ACR. Las salidas del modelo en los dos modos se denominan MOS-LQOn y MOS-LQOf. Como es el caso de [b-UIT-T P.861] y [b-UIT-T P.862]@, el enfoque de UIT-T P.863 se denomina 'referencia completa' o 'doble extremo'@, lo que significa que la predicción de la calidad se basa en la comparación entre una señal de referencia no distorsionada y la señal recibida que se va a calificar. UIT-T P.863 se puede aplicar a señales grabadas en una interfaz eléctrica (como fue el caso de [b-UIT-T P.862]), pero también a ?C en caso de funcionamiento en modo de banda completa. Las señales ?C grabadas utilizando un Simulador de oído artificial. Otras tecnologías o componentes@ como formatos de almacenamiento de voz@ o aplicaciones no telefónicas@ como redes de seguridad pública o conexiones de radio móviles profesionales@ no formaban parte del concurso ni de los criterios de selección. Modos operativos ITU-T P.863 Es importante comprender y considerar los dos modos operativos diferentes admitidos por ITU-T P.863: ? banda completa@ y ? Banda estrecha. El Cuadro 5 resume la aplicabilidad de los modos operativos UIT-T P.863 a diferentes escenarios de telecomunicaciones. La principal diferencia entre ambos modos es el ancho de banda de la señal de voz de referencia utilizada por el modelo, así como el rango de frecuencia donde se detectarán las distorsiones. En el modo de banda completa@, la señal de voz recibida (y potencialmente degradada) se compara con una referencia de banda completa. En consecuencia, las limitaciones de banda se consideran degradaciones y se califican en consecuencia. La calidad de escucha se modela tal como la percibe un oyente humano utilizando un auricular ecualizado de campo difuso con presentación diotica (la misma señal en ambos auriculares). La predicción utiliza una escala de calidad de escucha de banda completa donde el algoritmo ITU-T P.863 satura en MOS-LQOf = 4,8 para una señal de banda completa transparente. Las señales de banda completa se evaluaron en una prueba de escucha únicamente de ITU-T P.800 ACR en la fase de evaluación de ITU-T P.863. Por el contrario, en el modo de banda estrecha la señal vocal recibida (y potencialmente degradada) se compara con una referencia de banda estrecha (300 a 3 400 Hz). En consecuencia, las limitaciones de la banda telefónica normal no se consideran degradaciones graves y se puntúan menos. Este modo de banda estrecha mantiene la compatibilidad con modelos desarrollados anteriormente, como [b-UIT-T P.862] junto con [b-UIT-T P.862.1]. La calidad de escucha se modela tal como la percibe un oyente humano usando un auricular tipo IRS acoplado libremente en un oído (presentación monótica). La predicción utiliza la escala común de calidad de escucha de banda estrecha donde el algoritmo ITU-T P.863 satura en MOS-LQOn = 4,5 para una señal de banda estrecha transparente. NOTA 1 ?C Para los dos modos operativos@ las calificaciones de calidad se obtienen en dos escalas diferentes@ a saber, la escala tradicional para el modo de banda estrecha y la escala orientada al futuro para el modo de banda completa. NOTA 2 ?C Las grabaciones acústicas@ así como la influencia del nivel de presentación@ sólo se pueden predecir en el modo operativo de banda completa. El modo operativo de banda estrecha está restringido a grabaciones eléctricas y una presentación nominal para compatibilidad con [b-UIT-T P.862] junto con las áreas de aplicación de [b-UIT-T P.862.1]. NOTA 3 ?C Para compatibilidad con versiones anteriores, los archivos de referencia de banda súper ancha también se pueden utilizar en modo de banda completa. La diferencia entre una señal de banda superancha y una de banda completa es demasiado pequeña para identificarla en una prueba ACR típica y, por lo tanto, ITU-T P.863 las calificará como equivalentes. Sin embargo, se tendrán en cuenta las distorsiones en el rango de frecuencia entre la banda superancha y la banda completa, que pueden dar lugar a diferencias significativas entre las mediciones de banda superancha y de banda completa. Si la señal degradada también tiene un ancho de banda limitado al rango de banda superancha, los resultados de P.863 Ed. 3 y P.863 Ed. 2.0 será equivalente. 1 Esta Recomendación incluye un archivo adjunto electrónico que contiene descripciones detalladas en formato pdf (ver Anexo B) y datos de pruebas de conformidad (ver Anexo A).



© 2023 Reservados todos los derechos.