Meta se jacta de que su IA de vídeo puede «superar» a rivales como OpenAI

  • Meta acaba de lanzar Movie Gen, un generador de vídeo con IA para competir con Sora de OpenAI.
  • Movie Gen puede crear videos con audio adjunto mediante un mensaje de texto. También se puede editar mediante mensaje.
  • Meta se unió a la carrera de generación de videos más tarde que OpenAI y Google.

Meta lanzó el viernes una nueva herramienta de generación de videos de IA que también es la última andanada de la compañía en su batalla con OpenAI por la supremacía de la IA.

«Hoy estamos entusiasmados de presentar Meta Movie Gen, nuestra innovadora investigación de IA generativa para medios, que incluye modalidades como imagen, video y audio», dijo la compañía en un comunicado de prensa. «Movie Gen supera a modelos industriales similares en estas tareas cuando lo evalúan humanos».

En su comunicado de prensa, Meta llamó a Movie Gen «el conjunto de plantillas de narración más avanzado y atractivo», que incluye generación de video, generación de audio, generación de video personalizado y edición de video. Los modelos se entrenaron utilizando datos disponibles públicamente y datos autorizados, dijo la compañía.

Con un mensaje de texto, Movie Gen puede crear vídeos de hasta 16 segundos de duración a 16 fotogramas por segundo razonando «sobre el movimiento de objetos, las interacciones sujeto-objeto y el movimiento de la cámara». Los usuarios pueden cargar una foto de ellos mismos para incrustarla en videos personalizados, y Movie Gen puede editar videos con instrucciones de texto del usuario.

El video de muestra de Meta muestra una perspectiva submarina de un bebé hipopótamo (¿alguien hace referencia a Moo Deng?) nadando felizmente en una tranquila escena acuática.

En otra se muestra un koala sobre una tabla de surf y el mensaje que lo acompaña: “Un koala peludo surfea. Tiene un pelaje gris y blanco y una nariz redonda. El koala se agarra a la tabla de surf con la cara del oso koala. La expresión está concentrada. El sol está brillando.»

Con la generación de audio, los usuarios pueden «crear y ampliar efectos de sonido, música de fondo o bandas sonoras completas» de hasta 45 segundos de duración, se lee en el comunicado de prensa. Un clip de ejemplo de una serpiente. gatear por una zona boscosa incluye el Pista: “Las hojas crujen y las ramitas se rompen, con una pista musical orquestal”.

Meta llega un poco tarde al juego de generación de audio y video, ya que importantes competidores como OpenAI y Google ya se han afianzado en este espacio. OpenAi lanzó Sora, su generador de vídeo, en febrero, y Google hizo lo mismo con Veo en mayo.

Meta, sin embargo, le ha dado a OpenAI una carrera por su dinero en la carrera armamentista de la IA. Aunque ChatGPT de OpenAI debutó primero y lanzó a la empresa a la fama mundial, las versiones recientes del modelo Llama de Meta han sido bien recibidas. Muchos consideraron que Llama 3.1, lanzado en julio, era superior al GPT-4o de OpenAI, lanzado poco antes.

Meta afirma que sus nuevos «modelos de última generación» superan a sus competidores en comparaciones A/B humanas. Para la generación de videos, los encuestados de Meta prefirieron Movie Gen a OpenAI Sora, según el comunicado de prensa de la compañía. Meta no compartió una comparación A/B con Veo de Google, que también ofrece efectos de sonido y música, pero Meta dijo en un extenso artículo de investigación adjunto que cree que los modelos de generación de video a audio de Google pueden ser más limitados en duración en comparación con aquellos. de Meta. .

Meta, OpenAI y Google no respondieron de inmediato a una solicitud de comentarios.