Las tecnologías destacadas de "Data Lake Parte 4: Requisitos técnicos para la aplicación de inteligencia artificial" incluyen: (1) Investigación sobre tecnología de seguridad informática de privacidad para establecer un mecanismo de seguridad de datos rastreable para satisfacer las necesidades de seguridad de los datos. La investigación se basa en tecnología de aprendizaje federado para resolver el problema de la colisión de datos en escenarios donde los datos no salen del dominio y propone métodos para la integración integral de datos y la incubación de modelos de alto valor. Basándonos en hardware de ejecución confiable y otras tecnologías de cifrado, creamos un entorno seguro y confiable para la incubación de modelos después de que los datos salen del dominio, haciendo que los datos estén disponibles y sean invisibles, garantizando la privacidad, la seguridad y el cumplimiento de los datos. (2) La tecnología de almacenamiento jerárquico inteligente tiene en cuenta las características jerárquicas de los datos fríos y calientes. Por un lado, requiere capacidades de almacenamiento de gran capacidad y bajo costo y, por otro lado, requiere capacidades de recuperación rápida de datos durante el entrenamiento. . Investigue el almacenamiento de rayos azules y la tecnología de almacenamiento jerárquico inteligente integrado magneto-óptico-eléctrico para almacenar datos masivos en medios de rayos azules de bajo costo, mientras precarga datos de entrenamiento en medios magnéticos o dieléctricos de alto rendimiento. Además, el almacenamiento jerárquico también considera el mecanismo RAID de alta confiabilidad, capacidades de replicación automática de objetos y servicios de cifrado de datos confidenciales para mejorar la solidez de la biblioteca de recursos y garantizar la seguridad del almacenamiento de datos. (3) La tecnología de inferencia y entrenamiento distribuido enfrenta los desafíos que plantean los modelos de parámetros extremadamente grandes y datos masivos a los recursos y la duración del entrenamiento, explora el mecanismo de división de datos de entrenamiento e integra miles de aceleraciones de GPU a través de paralelismo de datos, paralelismo de modelos, paralelismo híbrido, etc. El modo de computación paralela de la tarjeta permite un entrenamiento distribuido a gran escala y garantiza una capacidad de expansión lineal de 0,9+. Al mismo tiempo, en función de los cambios en los requisitos de las tareas, ajustamos automáticamente la asignación de recursos, estudiamos la arquitectura de razonamiento elástico y escalable y mejoramos las capacidades de servicio elástico del razonamiento algorítmico, desarrollamos herramientas de servicio de razonamiento que son compatibles con múltiples marcos de aprendizaje profundo y se adaptan a; Se logra una variedad de potencia informática doméstica y se logra una programación unificada de recursos informáticos heterogéneos.
T/AI 126.4-2024 Historia
2024T/AI 126.4-2024 Lago de datos Parte 4: Requisitos tecnológicos para aplicaciones de IA