430auto.com | 08. 08. 2024 | Editor:Teresa Zheng | [A A A] |
La entrada de ByteDance en la industria de la conversión de texto a vídeo subraya la intensa competencia
La entrada de la empresa tecnológica china ByteDance en la industria de la conversión de texto a vídeo subraya la intensa competencia entre las empresas chinas y estadounidenses en el campo de la IA, en rápida evolución, especialmente después de que OpenAI, con sede en Estados Unidos, presumiera de su destacada creación, Sora.
Jimeng AI, desarrollado por Faceu Technology bajo ByteDance, ya se ha lanzado en la App Store de Apple para los usuarios de China. La aplicación se lanzó anteriormente en Android el 31 de julio, según informes de los medios.
Los observadores de la industria dijeron que su efectividad creativa está en consonancia con los puntos de referencia de la industria, lo que demuestra la fortaleza de mantenerse al día con la tecnología de vanguardia internacional.
Tras la presentación del exitoso modelo de texto a vídeo de OpenAI, Sora, en febrero, que hasta ahora no está disponible para uso público, en los últimos meses se han lanzado modelos similares en China.
Tras el lanzamiento de Sora, muchos otros desarrolladores se han puesto al día rápidamente, incluidos Pika y Runway, los grandes modelos de conversión de texto a video o multimodales producidos en China comenzaron a ganar impulso alrededor de junio de este a?o, dijo Li Baiyang, profesor del centro de investigación de innovación en gestión de datos de la Universidad de Nanjing, al Global Times.
"Al comparar los grandes modelos multimodales de China y Estados Unidos, no nos estamos quedando atrás en absoluto, y en muchos parámetros y conceptos, ya estamos liderando", declaró Li.
La startup china de IA Zhipu AI también presentó su propio producto de generación de video, Ying, en julio. La IA Kling de Kuaishou ha sido reconocida por profesionales extranjeros por su rendimiento constante y su capacidad para simular las características del mundo físico con un alto grado de precisión, además de su fuerte capacidad de combinación conceptual e imaginación.
Cabe destacar que Vidu, desarrollado por una empresa tecnológica china, se puso a disposición de los usuarios, con funcionalidades básicas de generación de vídeos e imágenes a partir de texto. En solo 30 segundos, puede producir un video de 4 segundos con una resolución de hasta 1080P. Los usuarios pueden registrarse directamente usando su correo electrónico para experimentar el producto.
El científico jefe de Vidu y subdirector del Instituto de IA de la Universidad de Tsinghua, Zhu Jun, declaró: "Después del lanzamiento de Sora, descubrimos que es altamente consistente con nuestra ruta técnica, lo que también nos hace promover firmemente nuestra propia investigación".
Según Shen Yang, profesor de inteligencia artificial y medios de comunicación en la Universidad de Tsinghua en Beijing que con frecuencia prueba todo tipo de productos de IA, China y otros países líderes están básicamente sincronizados en términos de productos de texto a video, con una brecha relativamente peque?a en términos de la consistencia de los caracteres en el video, la causalidad del mundo macrofísico, y la cognición de estas asociaciones.
Shen explicó al Global Times el miércoles que, especialmente Runway sobresale actualmente en la expresión artística con un fuerte sentido cinematográfico, mientras que Kuaishou, de China, demuestra una ligera ventaja en la producción de video del mundo real. La IA de Jimeng aún no ha sido probada por Shen.
Los productos desarrollados por empresas chinas exhiben un nivel significativo de precisión en la comprensión de la semántica china, en contraste con los desarrollados por empresas tecnológicas estadounidenses. Por ejemplo, escenarios como la creación de ropa tradicional china o revivir recuerdos de la infancia se basan en datos del idioma chino y se adhieren a las preferencias estéticas chinas, dijo Li.
El procesamiento de texto a vídeo requiere muchos recursos. A medida que aumenta la duración de los vídeos, también aumenta la demanda de potencia informática. Para lograr un equilibrio financiero, las empresas tecnológicas chinas y estadounidenses han comenzado a imponer tarifas por el uso de este servicio. Los altos costos asociados con esta tecnología plantean desafíos comunes para todos los involucrados, particularmente considerando la duración limitada de los videos generados, según lo observado por los expertos de la industria.
En la nueva ronda de competencia científica y tecnológica global, China saldrá con un "camino de China", es decir, más estrechamente integrado con la industria, o incluso derivado directamente del campo industrial, afirmaron los observadores.