Noticias Destacadas

Claude no es un gran jugador de Pokémon, y esto es bueno

si Claude juega Pokémon Se supone que da una idea del futuro de la inteligencia artificial, no es una oferta muy convincente. Durante el último mes y cuenta Pokémon rojo. A través de varias carreras, Claude no pudo superar el juego de aproximadamente 30 años. Hasta ahora para David Hershey, el principal desarrollador de proyectos, la oferta ha tenido éxito.

«Quería un lugar donde pudiera entender cómo Claude lidió con las situaciones en las que necesita trabajar durante un período muy largo», me explica Hershey sobre una videollamada. Como parte de su función diaria en humanos, Hershey trabaja en el equipo para ir al mercado donde los clientes de la compañía ayudan a crear sus propios agentes (más sobre eso en un momento). El trabajo comenzó por primera vez en Claude Playing Pokemon como un proyecto paralelo pronto 3.5 Sonata En junio pasado.

También puede adivinar el nombre, el proyecto se inspiró parcialmente Nashl Play PokemonQue apareció por primera vez en 2014 y fue testigo de 1.16 millones de puestos en un intento de perspectiva Pokémon rojo Uso de los espectadores de las entradas escritas solo en el cuadro de transmisión. Hershey no fue el primer empleado de AngropRie en tratar de formular a Claude en el campeón de la Liga Pokémon, pero el proyecto se quitó la vida cerca de la participación.

En los primeros días del proyecto, fue genial cuando Claude logró abandonar la casa de Red y encontrar al profesor Ok. «Pasé algunas horas malvadas al manipular para que logre este tipo de progreso», dice Hershey. Solía ​​actualizar a sus colegas en Claude en el canal de recesión interna. En este punto, la mayoría de la compañía no estaba interesada, y no se planeó compartir con el mundo.

Sin embargo, Hershey hizo costumbre reconsiderar el proyecto con cada emisión de nuevos modelos principales de antropología Claude 3.5 Sonata el otoño pasado Y nuevamente recientemente con 3.7 soneto. «Es la forma en que voy a ver,» ¿Qué es este nuevo modelo? «¿Cómo lo hace?» «¿Qué puedo aprender al respecto?»

Dentro del Anthrop, la esperanza era que Claude mejorara para probar diferentes estrategias y ajustar su enfoque cuando las cosas no salieron de acuerdo con el plan. con Pokémon rojo, La compañía vio a Claude para hacer estas cosas en un tiempo real. «(Claude 3.7 soneto) pasa menos tiempo en las suposiciones», dice Hershey. «Todavía verás que él está adivinando, luego pasas varias horas en la creencia de que esto es cierto y tomas decisiones estúpidas mientras tanto, pero los modelos anteriores continuarán haciéndolo para siempre».

Un esquema muestra el progreso en tocar el Pokémon Rojo.
Antropópico

Literalmente, puedes ver a Claude desarrollándose y ejecutándose con estos supuestos. Cada paso lento en el juego precede a un párrafo del texto de la inteligencia artificial: «Me enfrenté a las bebidas salvajes mientras me movía a (24,24). Según mi estrategia, debo escapar de esta batalla para preservar los recursos», seguido de una imprenta de un botón. Luego vuelve a evaluar la condición del juego y lo hace de nuevo.

Si estás viendo Claude, estás arrugado Pokémon rojo Como fanático del juego, un modelo parece estar «menos atascado en suposiciones», especialmente cuando el chatbot se tropieza con frecuencia en áreas como bosques veridianos, y a veces durante varios días, debido al diseño de nivel de diseño. Sin embargo, es un signo prominente del tipo de sistema de inteligencia artificial representado por Claude 3.7.

Al igual que muchos sistemas de IA fronterizos modernos, el soneto Claude 3.7 es un modelo de lógica, lo que significa que está diseñado para abordar los problemas dividiéndolos en piezas más pequeñas. «Muchos de nuestros clientes están interesados ​​en la efectividad de Claude», explica Hershey. Para principiantes, Agentes de AIS o agente de AIS Son sistemas diseñados para planificar y llevar a cabo tareas complejas sin supervisión humana. En la actualidad, la mayoría de la gente piensa en la inteligencia artificial como una caja de chat vacía en espera de la respuesta a una pregunta, pero las luchas son solo la cara del consumidor de la industria; Los agentes son un paso gradual pero importante hacia la promesa de inteligencia general artificial.

Desde esta perspectiva, hay algunas cosas que hacen que Claude interpretar a Pokémon sea interesante. Primero, hay un hecho sorprendente, Hershey delegó mucha programación que hizo posible el proyecto Agente de codificación más antropiérgica Incluyendo una sobrecarga que le permite a Claude comprender Pokemon caña Mundo del juego.

Segundo, y lo más importante, Claude no fue previamente jugado Pokémon rojo. Chatbot conoce algunos de los conceptos básicos sobre el juego, como el nombre de cada capitán de gimnasio y el sistema que el jugador debe superar, pero no tiene cientos de años de conocer el juego como algunos como algunos Sistemas de inteligencia artificial especializados. «Puedes lanzar un modelo en un juego sin preparación, sin instrucciones, y puedes aprender todo en sí mismo», dice. «Mi objetivo es ser el más cercano a este aspecto».

Hershey tuvo que ayudar a Claude. Ya he mencionado el grado que le permite explicar Pokemon caña Interfaz. Pixel Art es algo que combate todos los sistemas de inteligencia artificial, y 3.7 Sonite no espera. Como seres humanos, nuestra imaginación hace un gran trabajo al llenar los detalles que sugirió algunos píxeles. Además, no «ve» Claude como lo hacemos.

Si ve esto de cerca, notará cada vez que mueva la personalidad del jugador, hará algunas entradas antes de volver a evaluar su sitio. Entre estos neumáticos, Claude no es ninguna entrada sensorial. No se puede ver la caminata roja, ni «oye» cuando sus entradas causan un árbol u otro obstáculo. La «visión débil» Claude es una de las principales razones por las que lucha con el juego; De hecho, Hershey tuvo que darle a Chatbot una forma de leer la memoria del juego, por lo que era probable que lo vinculara si la interpretación de la pantalla se ofendía.

Si el objetivo del proyecto es Claude para superar Pokémon rojoFue fácil. Hershey podría haber sido programado a través del juego para seguir a Chatbot, pero en este punto, todo lo que habría estado probando fue la calidad de Claude para un conjunto sólido de instrucciones. «Claude es muy bueno», dice Hershey. «Lo sabía. Todos lo sabíamos».

En cambio, al dejar a Claude en sus propios dispositivos, el nuevo modelo demostró que es mejor planificar, alcanzar nuevas estrategias y eventualmente intentar algo diferente cuando sus suposiciones están equivocadas. Uno de los más Nuevas soluciones Claude evolucionó durante su tercera carrera en el juego fue hacer que Pokemon se desmayara deliberadamente para poder escapar del Monte Moon.

Sin embargo, Claude puede ser mucho mejor en la planificación a corto y largo plazo. En el mismo ejemplo, ella acaba de mencionar, Claude eliminó todas sus observaciones en Mount Moon después de respirar en el cercano Centro Bokimon, creyendo incorrectamente que logró moverse en la cueva. Una de sus carreras prometedoras ha terminado después de que Claude no admitió que necesitaba hablar con Bill para avanzar en el juego. Me topé en un episodio interminable de tomar malas decisiones.

«Avanzando, no sé qué tan útil es internamente como estándar. Es posible que con un pequeño grupo de pequeñas habilidades, Claude mejore un poco y el juego se incague, y luego el estándar no es interesante», admite Hershey. «Puede ser que haya cosas que no entiendo completamente sobre lo que hará que nuestro próximo modelo sea un bien, y luego continuaremos aprendiendo muchas cosas adicionales en el camino».

En cuanto a lo que sucede después de eso, Hershey dice que no tiene una estrategia a largo plazo para jugar a Claude Pokemon. «Pasé mucho tiempo, mi esposa dirá mucho tiempo, mira en esta cosa», dice riendo. También tengo la sensación de Hershey que no está listo para cerrar el libro en el proyecto. «Me gustaría imaginar cada vez que aparezca un nuevo modelo, tocaré Pokémon con él y también mostraré al mundo eso».

Hasta entonces, Anthropor continúa, después de un reinicio reciente, en la transmisión de Claude Pokemon se reproduce en Nashil. El proyecto fue lo suficientemente exitoso como para inspirar a un desarrollador independiente para el programa A. Géminis toca Pokémon Mira, y si tengo que adivinar, veremos más imitadores antes de mucho tiempo.

Este artículo apareció originalmente en Engadget en https://www.engadget.com/ai/claude-isnt-a-great-pokemon-player-and-that-okay-151522448.html? Src = rss?

Source link

Publicaciones relacionadas

Mira también
Cerrar
Botón volver arriba