Genie 3 de Google Deepmind puede cambiar el estado de sus mundos de simulación dinámica

A principios de diciembre, Google Deepmind Cofre de Jenny 2. La familia Jenny de sistemas de inteligencia artificial es lo que se conoce como los modelos mundiales. Son capaces de generar imágenes como un usuario, ya sea humano o muy probablemente, agente de IA, moviéndose en todo el mundo que simula el programa. El video resultante puede parecer un videojuego, pero DeepMind siempre ha puesto a Genie 2 como una forma de entrenar otros sistemas de inteligencia artificial en lo que están diseñados para lograr. A través del nuevo modelo Genie 3, anunciado por el laboratorio el martes, DeepMind cree que ha hecho un mejor sistema para capacitar a los agentes de inteligencia artificial.
A primera vista, el salto entre Genie 2 y 3 no es tan emocionante como el modelo realizado por el modelo el año pasado. Con Genie 2, el sistema DeepMind puede generar mundos 3D, y puede reconstruir con precisión el entorno incluso después de que el usuario o un cliente de IA lo dejara para explorar otras partes de la escena creada. La consistencia ambiental fue a menudo una debilidad en los modelos mundiales anteriores. Por ejemplo, Dert oasis El sistema enfrentó un problema para recordar el diseño Minecraft Los niveles que generará.
En comparación, las mejoras realizadas por Genie 3 parecen más modestas, pero en una conferencia de prensa emitida por Google antes del anuncio oficial de hoy, el Shlomi Fructer, el director de investigación de DeepMind, Jack Parker, Depmind, argumentó que representan piedras importantes en el camino hacia la inteligencia pública artificial.
Entonces, ¿qué hace exactamente el genio 3? Para comenzar, los disparos salen en 720 píxeles, en lugar de 360 píxeles como su predecesor. También puede mantener una simulación «consistente» durante un período más largo. Genie 2 tenía un límite teórico de hasta 60 segundos, pero en la práctica, el modelo a menudo comenzaría con alucinaciones temprano. Por el contrario, DeepMind dice que Genie 3 puede funcionar durante varios minutos antes de comenzar a producir artefactos.
También es nuevo en el modelo la capacidad de llamar a «eventos globales viables». Genie 2 fue tan interactivo como el usuario o agente de inteligencia artificial pudo insertar pedidos de movimiento y el modelo respondería después de que tuviera unos momentos para crear el siguiente cuadro. Genie 3 hace este trabajo en el tiempo real. Además, es posible ajustar la simulación con el texto que requiere la guía de Genie para cambiar el estado del mundo que lo genera. En DeepMind, la forma fue informada insertando una bandada de ciervos en una escena de una persona que patinando en la montaña. Deepmind dice que los ciervos no se movieron de la manera más realista, pero esta es la característica mortal de Genie 3, dice Deepmind.
Como mencionamos antes, el laboratorio imagina principalmente la forma como una herramienta para la capacitación y evaluación de agentes de inteligencia artificial. Deepmind dice que Genie 3 se puede utilizar para enseñar sistemas de inteligencia artificial para abordar los escenarios «qué pasaría si» no está cubierto con su pre -entrenamiento. «Hay muchas cosas que deberían suceder antes de que se publique un modelo en el mundo real, pero vemos esto como una forma de entrenar modelos de manera más efectiva y aumentar su confiabilidad», dijo Fruchter.
GIF muestra la gran interacción de Genie 3,
(Google DeepMind)
A pesar de las mejoras de Deepmind to Genie, el laboratorio admite mucho trabajo por hacer. Por ejemplo, el modelo no puede generar sitios reales con total precisión, y se agota con la presentación del texto. Además, para que Genie sea realmente útil, DeepMind cree que el modelo debería poder mantener un mundo de simulación durante horas, no minutos. Sin embargo, el laboratorio siente que Jenny está lista para influir en el mundo real.
«Ya estamos en el punto de que no usará (genio) como el único entorno de entrenamiento, pero definitivamente puede encontrar cosas que los agentes no quieren hacer porque si se comportan en algunos entornos, incluso si estos ajustes no son perfectos, todavía es bueno saber eso», dijo Parker Holler. «Ya puedes saber a dónde va esto. Será cada vez más beneficioso con la mejora de los modelos».
Actualmente, Genie 3 no está disponible para el público en general. Sin embargo, DeepMind dice que funciona para hacer el modelo a los laboratorios adicionales.