Siete nuevas características de Géminis anunciaron Google en E/S 2025

Nota de apertura 2025 de Google I/O Puede ser el más llamado Google AI. Casi todo lo que habló la compañía es la misma Amnistía Internacional, y algunos lo prometieron llegar al futuro, algunos de los cuales están disponibles hoy. Las características se han publicado a través de la colección completa de productos de Google, pero debajo de algunas de las que probablemente veas.
Es difícil hablar de Gemini porque indica simultáneamente a un conjunto de modelos (como Gemini Flash, Gemini Pro y Gemini Pro Deep Research), diferente Versiones Entre estos modelos (el último es 2.5 para la mayoría de estos), y Varias aplicaciones por las que están disponibles estos modelos. Hay una aplicación Gemini dedicada, asistente de audio en cosas como píxeles y relojes, así como herramientas de Géminis incluidas en aplicaciones como Google, Documentos Gmail o búsqueda.
Haré todo lo posible para determinar las características que llegan a los productos, pero tenga en cuenta que Google a veces tiende a Anuncie lo mismo varias veces.
La posición del agente llega a Géminis, investigación y más
Gemini obtiene un nuevo agente que puede realizar tareas para usted mientras hace algo más. Google ha ofrecido un ejemplo de la demanda de Gemini de encontrar apartamentos en la ciudad. La solicitud luego busca en las listas en línea, las envía de acuerdo con los criterios que determina, y puede proporcionarles que prepare tours residenciales para usted.
El aspecto más interesante de esto es que Google ofrece esto como una tarea que puede repetir Gemini regularmente. Por lo tanto, por ejemplo, si desea que Gemini busque nuevos apartamentos cada semana, la aplicación puede repetir el proceso y continuar la información en las repeticiones anteriores de la búsqueda.
El estado del agente de manera similar viene a buscar Google para ciertas solicitudes. Google usa un ejemplo para pedir boletos para un próximo evento. Los sitios de la lista de boletos de Google Scours, las revisiones cruzadas de sus preferencias y los resultados.
Gmail fingirá que cuando responda a sus correos electrónicos
Gmail tuvo respuestas inteligentes por un tiempo, pero podría verse hermosa general (Sin interferenciaDe todos modos). Es un regalo muerto para su receptor que realmente no le importa. Para ayudarlo a mantenerse alejado inhibiendo a sus amigos en silencio, Gmail podrá adaptar sus respuestas a usted Refiriéndose a correos electrónicos anteriores e incluso documentos de conducción.
Google usa un ejemplo de un amigo que pregunta cómo planeó para sus últimas vacaciones, lo cual es común que todos enviamos por correo electrónico todo el tiempo. En este caso, Gmail puede formular una respuesta basada en su registro de correo electrónico, con el consejo que probablemente brinde, e incluso escribir cómo la inteligencia artificial cree que escribirá.
Los resúmenes de los pensamientos resumirán cómo la inteligencia artificial resume el proceso de pensamiento
Sí, he leído esto bien. Los modelos de «pensamiento lógico» generalmente funcionan tomando su consulta, creando un texto que lo divide en piezas más pequeñas y enviándolo Aquellos Partes a la inteligencia artificial nuevamente, luego implementa cada paso. Esta es muchas instrucciones detrás de escena en su nombre. Por lo general, tiene modelos de pensamiento (incluido Géminis) ligeramente disminuido para mostrarle los pasos que ha tomado.
Si esto es mucha lectura para ti, entonces Géminis lo hará ahora Resumir Resumen del proceso de pensamiento. En teoría, esto es para facilitar la comprensión de la razón de Géminis a las respuestas que le dan.
Se susurrará la salida de su voz original (en sus pesadillas)
Esta es una característica técnicamente nueva de la unión de coco, lo que significa que los desarrolladores pueden construir estas herramientas en sus aplicaciones. El sonido original de los desarrolladores permitirá que la generación genere un discurso natural. En el programa experimental, Google mostró sonidos que podrían girar entre varios idiomas, que fueron geniales.
¿Qué piensas hasta ahora?
Sin embargo, el modelo es impresionante que el modelo también puede Susurro. Todavía no sé qué uso práctico de un sonido creado a partir de inteligencia artificial se puede susurrar, pero sé que no podré sacarlo de mi cabeza durante una semana. a lo mejor.
Jules arreglará los errores del código en segundo plano mientras trabaja
El año pasado, Google Gul anunciadoEl agente de codificación que puede ayudarlo en su código, similar Copiloto. Ahora, y La versión experimental general de Guls está disponible. Google dice que Jules puede corregir errores mientras trabaja en otras tareas, montando versiones e incluso proporcionando un resumen de audio de los cambios realizados en su código.
No soy genial al fotografiar una pieza de ropa en mi propio cuerpo, por lo que esta nueva característica de intento puede ser realmente útil. Google es Lanzamiento de la experiencia de laboratorio de búsqueda Esto le permite descargar una imagen completa de usted que Google la cambiará para mostrarle la forma de la ropa.
La compañía también integra las herramientas de compra que pueden comprar artículos para usted e incluso rastrear el mejor precio. Podrá comprar cosas para usted a través de Google Pay, utilizando información de pago y envío reservados. Esto aún no está disponible, francamente, queremos obtener más información sobre cómo funciona el proceso y cómo prevenir las compras que no desea antes de recomendarlo usarlo.
Los nuevos modelos Veo e Imamen crearán sonido y video.
El video es, desde un punto de vista educativo, una serie de imágenes que se reproducen lo suficientemente rápido como para transferir un sentido de movimiento. Con esta definición, puedo decir con confianza que ofrece la aclaración El nuevo modelo VEO 3 de GoogleDe hecho, vista de video. Si este video es bueno En el ojo del espectadorSupongo.
Google parece estar apostando a que los usuarios que encuentran el video creado por VEO 3 (e enredados, imágenes de Imagen 4) son dignos de atención, porque la compañía también está construyendo el ala de edición de video a su alrededor. Flow es la herramienta de edición de video que permite a los editores extender los clips y reclutarlos para obtener la apariencia correcta.
Google también dice que VEO 3 puede crear sonidos para que coincidan con su video. Por ejemplo, en la escena del búho asociado anteriormente, VEO también genera efectos de sonido forestales. Tendremos que ver cómo nacen estos elementos (¿puede editar claramente los sonidos individuales, por ejemplo?) Pero en la actualidad, las ilustraciones hablan de sí mismos. Veo 3 ahora está disponible en la aplicación Gemini para los suscriptores Ultra.