Siete nuevas características de Géminis que Google anunció en la E/S 2025

Nota de apertura 2025 de Google I/O podría haberse llamado más razonablemente el programa Google AI. Casi todo lo que la compañía habló fue de IA, algunos de los cuales se promete llegar en el futuro, y algunos de los cuales están disponibles hoy. Las características se extendieron en toda la gama de productos de Google, pero estos son algunos de los que realmente es probable que veas.
Es difícil hablar sobre Gemini porque se refiere simultáneamente a un conjunto de modelos (como Gemini Flash, Gemini Pro y Gemini Pro Deep Research), diferente versiones de esos modelos (el último parece ser 2.5 para la mayoría de estos), y Diferentes aplicaciones por las que están disponibles estos modelos. Está la aplicación Dedicada Gemini, el Asistente de Voz en cosas como Pixel Telehs and Watches, así como herramientas Gemini integradas en aplicaciones como Google Docs, Gmail o Search.
Haré todo lo posible para especificar qué características están llegando a qué productos, pero tenga en cuenta que a veces Google tiende a Anuncie lo mismo varias veces.
El modo de agente está llegando a Géminis, búsqueda y más
La aplicación Gemini está obteniendo un nuevo modo de agente que puede realizar tareas para usted mientras hace otra cosa. Google mostró un ejemplo de pedirle a Gemini que busque apartamentos en una ciudad. La aplicación luego busca en listados en línea, los filtra según los criterios que establece y puede ofrecer organizar recorridos de apartamentos para usted.
El aspecto más interesante de esto es que Google presenta esto como una tarea que puede hacer que Gemini repita regularmente. Entonces, por ejemplo, si desea que Gemini busque nuevos apartamentos cada semana, la aplicación puede repetir el proceso, continuando con la información en iteraciones anteriores de la búsqueda.
El modo de agente está llegando de manera similar a Google Búsqueda de ciertas solicitudes. Google usa el ejemplo de pedir boletos para un próximo evento. Google Scours Sitios de listado de boletos, referencias cruzadas contra sus preferencias y presenta los resultados.
Gmail fingirá ser usted cuando responda a sus correos electrónicos
Gmail ha tenido respuestas inteligentes por un tiempo, pero pueden sonar bastante genéricos (sin intervenciónde todos modos). Es un sorteo muerto para su destinatario que realmente no está prestando atención. Para ayudarte a salirse con la suya con fantasmas en silencio, Gmail pronto podrá adaptar sus respuestas a usted refiriéndose a sus correos electrónicos anteriores e incluso impulsar documentos.
Google usa el ejemplo de un amigo que pregunta cómo planeó sus vacaciones recientes, algo común que todos nos enviamos un correo electrónico todo el tiempo. En este caso, Gmail puede redactar una respuesta basada en su historial de correo electrónico, con el consejo que probablemente dará, e incluso escribirlo cómo la IA cree que la escribiría.
Los resúmenes del pensamiento resumirán cómo AI resume su proceso de pensamiento
Sí, lo leíste bien. Los modelos de «razonamiento» de IA generalmente funcionan tomando su consulta, generando texto que lo descompone en partes más pequeñas, enviando aquellos Partes a la IA nuevamente, luego llevando a cabo cada paso. Eso es muchas instrucciones detrás de escena en su nombre. Por lo general, los modelos de razonamiento (incluido Gemini) tendrán un pequeño menú desplegable para mostrarle los pasos que tomó en el ínterin.
Si incluso eso es demasiado lectura para ti, Géminis lo hará ahora resumir El resumen del proceso de pensamiento. En teoría, esto es facilitar la forma de entender por qué Géminis llegó a las respuestas que le da.
La salida de audio nativa te susurrará (en tus pesadillas)
Esta es técnicamente una nueva característica de la API de Géminis, lo que significa que los desarrolladores pueden aprovechar estas herramientas en sus aplicaciones. La salida de audio nativa permitirá a los desarrolladores generar un discurso de sonido natural. En su demostración, Google mostró voces que podían cambiar entre varios idiomas, lo cual fue bastante bueno.
¿Qué piensas hasta ahora?
Sin embargo, lo que no es tan genial es que el modelo también puede susurro. Todavía no sé cuáles son los casos prácticos de uso para una voz generada por IA que puede susurrar, pero sé que no podré sacarlo de mi cabeza durante una semana. A lo mejor.
Jules solucionará los errores de su código en segundo plano mientras trabaja
El año pasado, Google anunciado Julesun agente de codificación que puede ayudarlo con su código, similar a Copiloto de Github. Ahora, el Beta pública de Jules está disponible. Google dice que Jules puede solucionar errores mientras trabaja en otras tareas, las versiones de dependencia del aumento e incluso proporcionar un resumen de audio de los cambios que se realiza a su código.
No soy genial para visualizar cómo se verá una pieza de ropa en mi cuerpo particular, por lo que esta nueva función de prueba podría ser realmente útil. Google es Lanzamiento de un experimento de Search Labs Eso te permite subir una foto de largo longitud que Google alterará para mostrar cómo te verá la ropa.
La compañía también está integrando herramientas de compra que pueden comprar artículos para usted e incluso rastrear por el mejor precio. Luego podrá comprar cosas para usted a través de Google Pay, utilizando su información de pago y envío guardados. Este aún no está disponible, y francamente nos gustaría aprender un poco más sobre cómo funciona el proceso y cómo prevenir las compras que no desea antes de recomendarlo usarlo.
Nuevos modelos Veo e Imagen generarán audio y video
El video es, definitivamente, una serie de imágenes reproducidas a una velocidad lo suficientemente rápida como para transmitir un sentido de movimiento. Con esa definición, puedo decir con confianza que las demostraciones de El nuevo modelo VEO 3 de Google lo haceDe hecho, muestra video. Si ese video es bueno es en el ojo del espectadorSupongo.
Google parece estar apostando a que los usuarios que encuentren el video generado por VEO 3 (y, por asociación, las imágenes de Imagen 4) valgan la pena, porque la compañía también está construyendo una suite de edición de video a su alrededor. Flow es una herramienta de edición de video que aparentemente permite a los editores extender y reinterpretar clips para obtener el aspecto correcto.
Google también dice que VEO 3 puede generar sonidos para acompañar su video. Por ejemplo, en la escena del búho vinculada anteriormente, VEO también genera efectos de sonido forestales. Tendremos que ver cómo genera estos elementos (¿puede editar suena de forma clara, por ejemplo?) Pero por ahora las demostraciones hablan por sí mismas. Veo 3 ahora está disponible en la aplicación Gemini para los suscriptores Ultra.