Una herramienta de IA para borrar objetos y reescribir la física de las escenas
¡Alerta, cinéfilos! Netflix ha lanzado una herramienta de IA innovadora, capaz de eliminar objetos de video y recomponer la escena con una física sorprendente. Descubre cómo esta tecnología está cambiando las reglas del juego.
¿Qué es VOID y Cómo Funciona?
El framework VOID (Video Object and Interaction Deletion) no solo elimina objetos, sino que predice las interacciones físicas del entorno. A diferencia de los métodos tradicionales que solamente rellenan con un fondo estático, VOID reemplaza de manera realista los escombros o salpicaduras, garantizando que el escenario siga de manera coherente tras la eliminación de un objeto.
El Secreto del Pipeline de Múltiples Modelos
VOID utiliza un avanzado pipeline de modelos para lograr sus resultados impresionantes. CogVideoX sirve como base, mientras que Gemini 3 Pro analiza las escenas y SAM2 se encarga de la segmentación. Quizá lo más innovador sea la técnica ‘quadmask’ que guía el modelo de difusión y garantiza que cada pequeño detalle cuente.
Colaboración Internacional y Preferencia del Público
Este proyecto fue desarrollado en colaboración con la Universidad de Sofía. En pruebas, VOID fue preferido por el 64.8% de los participantes sobre otros métodos como Runway. Un éxito rotundo que destaca la ventaja competitiva de VOID en la industria.
Disponibilidad y Requisitos Técnicos
El código de VOID y su demostración están disponibles en plataformas como GitHub, arXiv y Hugging Face. Para ejecutarlo, se requiere una GPU con 40GB de VRAM. Actualmente, no se ha anunciado su integración directa en los flujos de producción de Netflix.

Sin duda, VOID supone un avance significativo en la edición de video. Aunque aún no forma parte de la producción de Netflix, creemos que su potencial es inmenso. ¡No esperamos menos de una compañía tan puntera en tecnología! No vemos la hora de que los usuarios puedan experimentar con esta herramienta en aplicaciones más cotidianas. Atentes, porque esto va a ser grande, aunque haya errrores por corregir.
Resumen de la noticia en formato de voz
Escucha este resumen narrado de la noticia, creado automáticamente por AYR Creations para brindarte una experiencia informativa clara, práctica y rápida.
Fuente: ayrcreations.com
Más noticias:
- ¿Es más seguro el reconocimiento facial o la huella dactilar?
- ¿Formatear el ordenador lo deja como nuevo si va muy lento?
- Qué son los metadatos de las fotos y por qué ponen en riesgo tu privacidad
Falsa física, mejor no.
Impresionante avance en edición de video.
Interesante desarrollo 🧐
Física compleja.
¡Un salto gigantesco en la edición de video! La física realista es asombrosa.
¿Cómo afecta a la trama? 🤔
Un avance fascinante en la edición de video.
Herramienta genial.