Mundo

Probé la herramienta Google Veo 3 que hizo esos videos virales, y no es tan bueno como piensas


Sabemos que AI Tech está progresando a un ritmo rápido, y la reciente presentación de Google del generador de video VEO 3 destacó esto una vez más. VEO 3 es un paso adelante en términos de realismo y agrega audio por primera vez. La mayor parte del tiempo, las salidas de VEO 3 son prácticamente indistinguible de videos reales.

Todavía no es perfecto, pero Veo 3 está tomando Internet por asalto, con clips virales que cubren todo desde entrevistas callejeras a tormentas de asalto incompetentes. Representar a los soldados del Imperio Galáctico es al menos una forma de garantizar la consistencia entre los clips, porque, por supuesto, todos se ven iguales.

Google en sí también ha proporcionado un showreel de videoclips de aspecto impresionante, que incluyen un marinero en el mar y un violinista clásico. Debe verse muy, muy difícil decir que estos videos son IA, e incluso entonces no siempre es posible.

Pero esos son los resultados finales. ¿Qué pasa con el proceso de creación? Si le paga a Google por una suscripción de IA, puede producir su propio VeO 3 videos, y hay un par de formas de hacerlo, que entraré aquí.

Toda esta creación de video de IA debe ponerse en contexto cada vez: hay signos de interrogación sobre la tecnología en términos de uso de energía, infracción de derechos de autorla amenaza de las industrias creativasy propagación de información erróneatodo lo cual hemos escrito extensamente antes.

Creación de videos con VEO 3

Si paga $ 20 al mes por el plan Google AI Pro, entonces obtiene tres generaciones de videos Veo 3 por día en la aplicación Gemini, utilizando el modelo rápido VEO 3 de menor calidad más rápido. Si te has ido grande con los $ 250 por mes Google tiene ultra planObtiene los «límites más altos» para el acceso completo a VEO 3: Google no cuantifica esto exactamente, por lo que puede que no haya un techo duro, y puede fluctuar según la demanda. Cada video se fija en ocho segundos.

Si está utilizando las herramientas de flujo y batir para su creación de video, en lugar del chatbot Gemini, es un poco diferente: obtiene 1,000 créditos de IA en el plan Pro por mes y 12,500 créditos en el plan Ultra. Un video estándar VEO 3 le devolverá 100 créditos, y un video rápido VEO 3 le costará 20 créditos, y en estas herramientas, la resolución puede aumentar a 1080p (es 720p si está utilizando la aplicación Gemini).

Aplicación Géminis

Creación de videos en la aplicación Géminis.
Crédito: Lifehacker

Según el de Google Josh WoodwardVeo 3 Fast es más rápido (obviamente), menos exigente en términos de procesamiento, y se adhiere a la misma resolución de 720p como VEO normal 3. No está claro exactamente qué compensaciones hay en términos de calidad (el equipo de Google no explicaría cuando pregunté por correo electrónico), pero anecdóticamente, Parece que algunas de las texturas, la iluminación y los detalles no son tan buenos. Dentro de la aplicación de flujo, hay una etiqueta que dice que Veo 3 rápidamente es un quinto la calidad de Veo 3.

Para comenzar a hacer videos, si eres un suscriptor de Google AI Pro como yo, debes dirigirte a la aplicación Géminis En la web (la creación de video móvil se limita a Google AI Ultra suscriptores por ahora). Haga clic en el selector de modelo en la esquina superior izquierda, luego elija 2.5 Pro (vista previa) o cualquiera que sea el último modelo para cuando esté leyendo esto: luego puede seleccionar Video En el cuadro de entrada de texto y estará listo para hacer algunas indicaciones.

Previamente, Usé Veo 2 para intentar recrear el Old Sony TV ADDonde miles de bolas hinchadas de colores son arrojadas por las calles de San Francisco. Los resultados No fui genialAsí que le di a Veo 3 Fast el mismo desafío. Como puede ver a continuación, obtuve un mejor video. Casi podría pasar como algo que se había filmado en la vida real (el sol a través de los árboles es genial), pero aún ignora la mayoría de mis instrucciones rápidas, y no es tan bueno como el anuncio de Sony.

Esto nos devuelve a la naturaleza de la IA generativa, que es imitar lo que se ha visto antes. Supongo que Veo 3 ha sido entrenado en muchas y muchas entrevistas callejeras Vox Pops, y no muchos anuncios en los que las bolas hinchables están en cascada en las colinas. También destaca que puede requerir muchas indicaciones para obtener lo que desea, y a lo largo de mis pruebas de video de IA, obtener herramientas para seguir las indicaciones es un desafío continuo.

Con solo dos Veo 3 generaciones restantes para el día, le encargué a Veo 3 rápidamente con la recreación de la clásica escena «Bienvenido al Parque Jurassic» En la película de Spielberg. De nuevo, es mejor que el esfuerzo VEO 2Pero hay problemas con la rápida adherencia, y hay demasiados paleontólogos. Sin embargo, los dinosaurios (y los sonidos de dinosaurios) están bien hechos.

¿Qué piensas hasta ahora?

Usando el flujo para crear películas más largas

Google también ofrece Batidor para animaciones y Fluir Para proyectos de películas más largos, utilizando los mismos modelos de IA que encontrará en la aplicación Gemini, correspondiente al plan al que está suscrito. Si no desea hacer videos propios, o es un usuario gratuito de Google Gemini, puede ver lo que otras personas han hecho Vía TV de flujo.

Una vez que se vuelva a fluir en su navegador web, haga clic en Nuevo proyecto para comenzar. Luego puede comenzar a solicitar, utilizando el botón de configuración en la parte superior derecha del cuadro de aviso para elegir el modelo que desea usar; verá cuántos créditos también usará la generación, antes de hacer cualquier representación.

Flujo de Google

Creación de videos en flujo.
Crédito: Lifehacker

Decidí salpicar 100 créditos para un clip Veo 3 completo adecuado en un intento de producir mejor la escena del Parque Jurassic en su totalidad y hacer que mi película de IA haga una carrera. Agregué un poco más de detalle a la solicitud, así como a algún diálogo, y lo que salió al otro extremo estaba a la par con la salida VEO 2. En realidad obtienes dos generaciones para elegir, que puedes ver aquí y aquí.

Una vez más, tenemos los problemas habituales, ya que el generador de IA realmente no sabe realmente lo que se supone que debe hacer aquí, o cómo construir una escena más allá de lo que se ve en otros videos. Nuestros intrépidos aventureros están mirando en la dirección equivocada cuando uno de ellos ofrece la línea «wow … ¿verías esa» línea, y todo, desde los dinosaurios hasta los árboles, se ve genérico?

La diferencia con el flujo y la creación de videos extendidos es que puede hacer clic Agregar a la escena En cualquiera de estos videos generados y comienza a construir algo más, compuesto por trozos de ocho segundos. Las escenas se pueden extender y organizar según sea necesario, con los mismos caracteres y entornos transportados de un clip a otro.

Mis intentos de conseguir John Hammond Entrar en la escena no funcionó realmente. Los personajes originales se mantuvieron en su lugar lo suficientemente bien, pero nuestro nuevo personaje apareció de la nada y todo el sonido se cortó de repente porque Flow de alguna manera me había cambiado a Veo 2. También obtuvimos un extraño batido de cámara a mitad de camino. Está claro que no voy a poder cambiar del periodismo tecnológico a la dirección de películas de IA en el corto plazo, especialmente con solo 1,000 créditos por mes.

Veo 3 todavía está en una etapa temprana, y Google ha puesto etiquetas «experimentales» por todas partes y la interfaz de flujo. Sin embargo, en este momento tendrá que gastar muchos créditos y mucho tiempo trabajando en las indicaciones para obtener algo que sea consistente y realista. Es probable que las horas de esfuerzo y las pruebas fueran en los pulidos videos de IA que ves poblando tus alimentos en las redes sociales.



Source link

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba