El modelo VEO 3 AI de Google crea videos

Como parte de los anuncios de este año en su conferencia Deleper de E/S, Google presentó los últimos modelos de generación de medios. El más prominente, tal vez, es Veo 3Es la primera repetición del modelo que puede crear videos con sonidos. Por ejemplo, se puede crear un video clip de pájaros con el sonido de su canto, o la calle de la ciudad con sonidos de tráfico en el fondo. Google dice que Veo 3 también se destaca en física en el mundo real y en la sincronización de los labios. Actualmente, el modelo solo está disponible para Gemini Ultra suscriptores en los Estados Unidos dentro de la aplicación Gemini y los usuarios empresariales en Vertex AI. También está disponible en Flow, que es la nueva herramienta de fabricación de películas de Google.
Desgarrar trae vero, imagen Géminis juntos para crear clips y escenas cinematográficas. Los usuarios pueden describir la salida final que desean en natural, y el flujo irá a trabajar para ellos. La nueva herramienta solo estará disponible para Google AI Pro y Ultra en los Estados Unidos en la actualidad, pero Google dice que pronto se extenderá a más países.
Si bien la compañía lanzó un nuevo modelo de generación de videos, Veo 2 aún no lo ha abandonado. Los usuarios podrán dar VEO 2 imágenes a las personas, escenas, patrones y objetos para usar como referencia para que fluya su salida deseada. Tendrán acceso a los controles de la cámara que les permiten girar las escenas y ampliar también en flujos de flujo específicos. Además, podrán expandir sus marcos de la imagen al paisaje si desean agregar o eliminar objetos de sus videos.
Google también presentó los últimos modelos de generación de fotos, Imagen 4, en este evento. La compañía dijo que Imagen 4 hace detalles precisos, como telas complejas y pieles de animales con «claridad notable» y superan la generación de imágenes realistas y abstractas. También es mucho mejor proporcionar la impresión de sus antepasados y puede crear imágenes de relaciones múltiples con decisiones de hasta 2K. Imagen 4 ahora está disponible a través de la aplicación Gemini y Vertex AI y en las aplicaciones del espacio de trabajo, incluidos documentos y diapositivas. Google dijo que también emitirá una versión de Imagen 4 diez veces más rápido que Imagen 3 «pronto».
Finalmente, para ayudar a las personas a identificar el contenido creado por la inteligencia artificial, que se ha vuelto más difícil en estos días, Google lanzó Synthid. Es un portal en el que los usuarios pueden descargar parte de los medios que creen que se pueden crear a partir de inteligencia artificial, y Google determinará si contiene SurcosoUna herramienta de marca de agua e identificación del arte de inteligencia artificial. Google ha abierto su herramienta de marca de agua, pero no todos los generadores de fotos la usan, por lo que la puerta aún puede determinar todas las imágenes creadas por inteligencia artificial.