Mundo

Cómo la investigación profunda de Claude se compara con Gemini y Chatgpt


TirarEl bot de IA de Anthrope, puede no tomar tantos titulares como Chatgpt, Géminiso copiloto, pero puede ser el que más recurro en este momento: es inteligente y exhaustivo, con una actitud hacia sus respuestas que a menudo parece menos robótica y sycófica que la producción que obtienes con muchos de sus rivales.

Una de las últimas características para lanzar a Claude, y que ya encontrará dentro de los bots de Google y OpenAi, es una investigación profunda, que Claude solo llama a la investigación. Es como una búsqueda web sobrealimentada, donde obtendrá un informe detallado y largo en lugar de unos pocos párrafos. Es adecuado para proyectos de investigación, como su nombre indica, o cualquier escenario en el que necesite una inmersión profunda en un tema.

Ahora, estos modelos de IA dependen de cualquier información que esté en la web. Por lo tanto, sus informes no serán tan completos si hay muy poco material en línea sobre el tema que le interesa. Si hay recursos para sacar, sin embargo, estas herramientas de investigación profundas generalmente hacen un buen trabajo al recopilarlo, y siempre vienen con citas y enlaces web para que pueda Verifique su trabajo.

Al momento de escribir, debe ser un usuario de Claude que paga (desde $ 20 al mes) para acceder a la herramienta de investigación. Simplemente seleccione el Investigación Opción en la ventana de inmediato, antes de escribir lo que desea que la IA busque. Para probar las capacidades, lo enfrenté con características similares disponibles en Chatgpt y Gemini para ver cómo se avanzaría Claude, usando sujetos sobre los que sé algo (para que pueda verificar más fácilmente los errores): el: el Samsung Galaxy S25 Ultra y las obras de David Lynch.

Investigando el Samsung Galaxy S25 Ultra

Claude Ai

Claude Research alcanza un buen equilibrio entre la velocidad y la profundidad.
Crédito: Lifehacker

Aquí está el aviso que utilicé para los bots: «Necesito saber lo más posible sobre el Samsung Galaxy S25 Ultra. ¿Cuáles son sus especificaciones y características clave? ¿Qué ha cambiado de la Galaxy S24 Ultra Ultra? ¿Cómo se compara con los otros modelos Galaxy S25? ¿Qué tipo de usuarios es adecuado para qué nos dice?

Claude saltó directamente a su investigación y tuvo un informe en siete minutos. Puede mostrar su pensamiento en el camino, si quieres verlo. El documento final que presentó fue minucioso y preciso, con enlaces de la web integrado para respaldar todo lo que se escribió. Recogió puntos clave, como el software AI y el S Pen Rechade, pero el texto tendió a ser un poco genérico y carente de sustancia en algunos lugares. Fue el más corto de los informes, llegando a 1.200 palabras.

Gemini produjo su informe en el tiempo más rápido, un poco por delante de Claude, mientras también escribió más de 5,500 palabras. Obtuve un plan de investigación para revisar y aprobar primero, y luego obtuve actualizaciones detalladas sobre dónde está haciendo Gemini, ya que explota la web. Encontré que el documento de investigación terminado es bastante detallado, incluso incluyendo horarios de procesador y la fecha y ubicación de la presentación del teléfono. También fue preciso y bien referenciado, por lo que pude ver, aunque se dirigió a Samsung Marketing Speak con bastante regularidad.

ChatGPT comenzó haciendo algunas preguntas aclaratorias, luego tomó más del doble que Claude y Gemini para producir un poco más de 5,100 palabras. Este bot le mostrará el más detalle en términos de actividad tal como funciona, aunque está oculto de forma predeterminada. Lo que obtuve al final fue otro informe bien investigado, bien formateado y preciso, con una buena variedad de detalles, aunque Géminis ofreció un poco más de contexto. Al igual que con Gemini, ChatGPT tenía una tendencia a levantar frases promocionales de los propios comunicados de prensa de Samsung, que no es necesariamente lo que desea.

Investigando David Lynch

Claude Ai

Su informe terminado se puede leer dentro de Claude o exportarse.
Crédito: Lifehacker

En el mundo de David Lynch, y esta vez mi mensaje fue: «Necesito un informe de investigación detallado sobre las obras de cine y televisión de David Lynch (no necesito saber sobre su música o arte en este caso). ¿Qué obras se consideran las más influyentes? ¿Cuáles son sus obras más celebradas y accesibles? ¿Qué define el estilo de David Lynch? ¿Qué impacto ha tenido en la industria?»

Claude fue nuevamente el más rápido y el más sucinto en su respuesta, produciendo poco menos de 1.200 palabras en poco más de cinco minutos. Eligió correctamente lo que se consideran los mejores trabajos de Lynch, y explicó por qué, y el informe hizo un buen trabajo al identificar películas y programas que han sido influenciados por Lynch. Si bien no es el más profundo en términos de investigación, Claude produjo una visión general fina.

Géminis tardó un par de minutos más que Claude para producir cerca de 7,000 palabras en David Lynch, y nuevamente presentó un plan de investigación primero. Al igual que con el informe de Samsung, Gemini agregó mucho más detalles que Claude: un resumen ejecutivo, una línea de tiempo de su carrera (completa con una mesa) y una visión exhaustiva de lo que realmente significa «Lynchian», que era bastante acertado, completo con citas del hombre mismo. Ciertamente sería un punto de partida integral si estuvieras investigando a Lynch.

¿Qué piensas hasta ahora?

ChatGPT tomó unos minutos más que Gemini para presentar su copia, que se extendió a casi 8,000 palabras. Una vez más, hubo preguntas aclaratorias al principio, lo que parece ser obligatorio. Hubo una cronología detallada, y el informe fue bien al seleccionar trabajos de Lynch que fueron celebrados o accesibles para hablar, así como para elegir algunos cortes más profundos y resumir con precisión lo que hace que Lynch sea diferente, aunque parecía confiar en un puñado de fuentes demasiado fuertemente.

El futuro de la investigación

Investigación de chatgpt

Chatgpt le mostrará todo su trabajo a medida que avanza.
Crédito: Lifehacker

Es difícil elegir un ganador aquí, ya que hay tantas variables, y cuando se trata de algo así como la longitud del informe, realmente depende de lo que esté buscando. Todos los chatbots se desempeñaron bien en sus tareas de investigación, pero si me vi obligado a elegir, tomaría los informes de Géminis: parecían un poco más detallados y bien pensados ​​que los demás.

No hay duda de que hay valor en lo que la búsqueda de IA puede hacer aquí, produciendo informes detallados y (aparentemente) precisos en minutos que podrían tomar un horario humano real. Cuando los bots están en este modo y se ven obligados a verificar su trabajo, en teoría debería haber menos posibilidades de que fabriquen hechos. Por lo que pude ver, eligieron sitios web respetables y autorizados como fuentes.

Como esta forma de trabajar se convierte en la norma, provoca dos preguntas: Primero, ¿qué podría suceder con nuestras habilidades para investigar y recopilar información con nuestros propios cerebros (ver también nuestras habilidades para resumir y escribir bien)? En segundo lugar, ¿cuál es el resultado final de que todos pasamos nuestro tiempo dentro de los bots de IA en lugar de en la red abierta?

Si AI pone a la mayoría de los sitios web su abastecimiento fuera del negocio, entonces estas herramientas serán mucho menos útiles. Los bots, por ejemplo, se dejarán tratar de resumir las obras de David Lynch de Reddit y Wikipedia, en lugar de los escritos de críticos profesionales y entrevistas con personas en la industria. Esta es una de las mejores aplicaciones de bots como Claude, Gemini y ChatGPT, pero solo porque pueden extraer la vasta biblioteca de contenido publicado en línea que también están poniendo en peligro.

Divulgación: la empresa matriz de Lifehacker, Ziff Davis, presentó una demanda contra Operai en abril, alegando que infringió los derechos de autor de Ziff Davis en la capacitación y la operación de sus sistemas de IA.



Source link

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba