Genie 3 de Google Deepmind puede cambiar el estado de sus mundos de simulación dinámica

Cedillo Alba agosto 5, 2025

0 3 minutos de lectura

A principios de diciembre, Google Deepmind Cofre de Jenny 2. La familia Jenny de sistemas de inteligencia artificial es lo que se conoce como los modelos mundiales. Son capaces de generar imágenes como un usuario, ya sea humano o muy probablemente, agente de IA, moviéndose en todo el mundo que simula el programa. El video resultante puede parecer un videojuego, pero DeepMind siempre ha puesto a Genie 2 como una forma de entrenar otros sistemas de inteligencia artificial en lo que están diseñados para lograr. A través del nuevo modelo Genie 3, anunciado por el laboratorio el martes, DeepMind cree que ha hecho un mejor sistema para capacitar a los agentes de inteligencia artificial.

A primera vista, el salto entre Genie 2 y 3 no es tan emocionante como el modelo realizado por el modelo el año pasado. Con Genie 2, el sistema DeepMind puede generar mundos 3D, y puede reconstruir con precisión el entorno incluso después de que el usuario o un cliente de IA lo dejara para explorar otras partes de la escena creada. La consistencia ambiental fue a menudo una debilidad en los modelos mundiales anteriores. Por ejemplo, Dert oasis El sistema enfrentó un problema para recordar el diseño Minecraft Los niveles que generará.

En comparación, las mejoras realizadas por Genie 3 parecen más modestas, pero en una conferencia de prensa emitida por Google antes del anuncio oficial de hoy, el Shlomi Fructer, el director de investigación de DeepMind, Jack Parker, Depmind, argumentó que representan piedras importantes en el camino hacia la inteligencia pública artificial.

Entonces, ¿qué hace exactamente el genio 3? Para comenzar, los disparos salen en 720 píxeles, en lugar de 360 píxeles como su predecesor. También puede mantener una simulación «consistente» durante un período más largo. Genie 2 tenía un límite teórico de hasta 60 segundos, pero en la práctica, el modelo a menudo comenzaría con alucinaciones temprano. Por el contrario, DeepMind dice que Genie 3 puede funcionar durante varios minutos antes de comenzar a producir artefactos.

También es nuevo en el modelo la capacidad de llamar a «eventos globales viables». Genie 2 fue tan interactivo como el usuario o agente de inteligencia artificial pudo insertar pedidos de movimiento y el modelo respondería después de que tuviera unos momentos para crear el siguiente cuadro. Genie 3 hace este trabajo en el tiempo real. Además, es posible ajustar la simulación con el texto que requiere la guía de Genie para cambiar el estado del mundo que lo genera. En DeepMind, la forma fue informada insertando una bandada de ciervos en una escena de una persona que patinando en la montaña. Deepmind dice que los ciervos no se movieron de la manera más realista, pero esta es la característica mortal de Genie 3, dice Deepmind.

Como mencionamos antes, el laboratorio imagina principalmente la forma como una herramienta para la capacitación y evaluación de agentes de inteligencia artificial. Deepmind dice que Genie 3 se puede utilizar para enseñar sistemas de inteligencia artificial para abordar los escenarios «qué pasaría si» no está cubierto con su pre -entrenamiento. «Hay muchas cosas que deberían suceder antes de que se publique un modelo en el mundo real, pero vemos esto como una forma de entrenar modelos de manera más efectiva y aumentar su confiabilidad», dijo Fruchter.

GIF explica Genie 3 '; — GIF muestra la gran interacción de Genie 3,
(Google DeepMind)

A pesar de las mejoras de Deepmind to Genie, el laboratorio admite mucho trabajo por hacer. Por ejemplo, el modelo no puede generar sitios reales con total precisión, y se agota con la presentación del texto. Además, para que Genie sea realmente útil, DeepMind cree que el modelo debería poder mantener un mundo de simulación durante horas, no minutos. Sin embargo, el laboratorio siente que Jenny está lista para influir en el mundo real.

«Ya estamos en el punto de que no usará (genio) como el único entorno de entrenamiento, pero definitivamente puede encontrar cosas que los agentes no quieren hacer porque si se comportan en algunos entornos, incluso si estos ajustes no son perfectos, todavía es bueno saber eso», dijo Parker Holler. «Ya puedes saber a dónde va esto. Será cada vez más beneficioso con la mejora de los modelos».

Actualmente, Genie 3 no está disponible para el público en general. Sin embargo, DeepMind dice que funciona para hacer el modelo a los laboratorios adicionales.

Source link

Cedillo Alba agosto 5, 2025

0 3 minutos de lectura

Genie 3 de Google Deepmind puede cambiar el estado de sus mundos de simulación dinámica

Cedillo Alba

Diecinueve serán honrados con el Premio al Servicio Meritorio de la Conmemoración de la Independencia 2025

Hoy es el día criollo en Dominique

Lo que alguna vez fue un enclave ‘azul’ típico de California, un paraíso junto a la playa ahora está ardiendo en rojo… y viene por Gavin Newsom

Mark Carney de Canadá se disculpa con Trump por anuncio antiaranceles

La vista previa: ¿Shankland es ahora el mejor hombre para liderar la línea de Escocia?

Estas son las mejores aplicaciones para estudiar

Gaza Ceasefire en duda sin negociaciones en curso para la segunda fase

Las mejores aplicaciones de videollamadas para reemplazar Skype

El alumno de ‘American Idol’, Colin Stough, arrestado por presunto DUI después del accidente

Crystal Palace vs Millwall-Copa FA: puntaje en vivo, noticias de equipo y actualizaciones de dramático choque de quinta ronda ya que los visitantes tienen un jugador enviado para una repugnante patada de Karate a Jean-Philippe Mateta, antes de llegar a cuartos de final

2025 Razzies: ‘Madame Web’ y ‘Megalopolis’ entre los grandes ‘ganadores’ de los peores de Hollywood

Subscribe to our mailing list to get the new updates!

Mi oferta favorita del día de Amazon: el Google Pixel 9a

La producción de Blue Eat está creciendo en Ordu: Kilograma encuentra compradores de 500 TL

Publicaciones relacionadas