Google busca reducir costos de IA para desarrolladores con nueva función de caché automática

En un esfuerzo por hacer más accesible el uso de inteligencia artificial avanzada, Google ha anunciado la integración de una nueva funcionalidad en su API de Gemini: el almacenamiento en caché implícito. Esta herramienta está diseñada para disminuir los costos operativos que enfrentan los desarrolladores al interactuar con los modelos de IA Gemini 2.5 Pro y Flash, ofreciendo, según Google, una reducción de hasta el 75 % en los costos relacionados con contextos repetitivos.

La inteligencia artificial generativa —como la que impulsa a Gemini— requiere grandes volúmenes de datos y cálculos complejos para funcionar correctamente. Cada vez que un desarrollador realiza una solicitud a través de la API, se procesan miles de «tokens», unidades de texto que representan fragmentos de palabras. Estos tokens representan un gasto computacional significativo, y por ende, económico. Frente a este desafío, la nueva función apunta a optimizar el procesamiento de información ya conocida por el modelo, reutilizando fragmentos comunes de solicitudes previas.

La técnica del almacenamiento en caché no es nueva en el mundo tecnológico. De hecho, se ha utilizado ampliamente para mejorar la eficiencia en distintas áreas, desde servidores web hasta bases de datos. En el contexto de la IA, permite que un modelo recuerde respuestas o instrucciones anteriores para evitar cálculos redundantes. Por ejemplo, si una solicitud frecuente incluye siempre los mismos datos al inicio, la IA puede «recordarlos» sin necesidad de procesarlos nuevamente desde cero.

Potenciando los servicios con nueva caché

Caché automática

Hasta hace poco, Google ofrecía una forma de almacenamiento en caché, pero de tipo explícito. Esta opción exigía que los desarrolladores identificaran manualmente las partes repetitivas de sus solicitudes, un proceso que no solo era técnico, sino también laborioso. Además, algunos usuarios reportaron que esta solución no siempre funcionaba de manera eficiente, generando en ciertos casos costos inesperadamente altos. Las críticas se intensificaron en semanas recientes, lo que llevó al equipo de Gemini a disculparse públicamente y a prometer mejoras.

LEER MAS  CES 2026: Samsung presenta AI Visión desarrollada con Gemini en electrodomésticos

La principal diferencia de esta nueva propuesta es que el almacenamiento en caché implícito es automático y está habilitado por defecto en los modelos Gemini 2.5. Esto significa que los desarrolladores ya no tendrán que hacer nada adicional para beneficiarse de esta optimización. Cada vez que una nueva solicitud comparta un comienzo similar con una solicitud anterior, el sistema detectará esta coincidencia y reutilizará parte del procesamiento anterior, lo que podría traducirse directamente en ahorros de costo.

Según la documentación oficial, se requiere un mínimo de 1024 tokens para que el almacenamiento en caché implícito se active en Gemini Flash 2.5, y de 2048 tokens para el modelo Pro 2.5. Esta cifra no es particularmente alta, por lo que se espera que muchos desarrolladores puedan beneficiarse de esta nueva herramienta sin cambiar demasiado sus flujos de trabajo.

Gemini y San Valentín

No obstante, no todo es tan simple como parece. Google sugiere estructurar las solicitudes de manera específica para maximizar el rendimiento del sistema de caché. En concreto, recomienda colocar el contexto repetitivo al principio de cada solicitud y dejar las partes variables al final. Esta organización aumenta las probabilidades de que una solicitud coincida con otras previamente procesadas, activando así el mecanismo de ahorro.

A pesar del entusiasmo inicial, persiste cierta incertidumbre. Google aún no ha presentado pruebas externas que respalden sus promesas de ahorro automático. Por ahora, la comunidad de desarrolladores deberá esperar a que los primeros usuarios compartan su experiencia real con la nueva función.

Con esta medida, Google apunta a consolidar a Gemini como una plataforma más accesible y competitiva frente a otras soluciones de IA. Si el almacenamiento en caché implícito cumple su promesa, podría representar un cambio importante en la forma en que se optimizan los recursos en aplicaciones basadas en modelos de lenguaje.

LEER MAS  Más personas desean televisores gigantes previo al Mundial

Puedes revisar más información relativa a noticias de tecnología | Instagram | YouTube

About The Author

Últimas Noticias

Red Hat Summit 2026: Una ruta para llevar la IA empresarial a la producción y con una base preparada para el cambio

En el Red Hat Summit 2026 se presentaron pasos concretos para que las empresas dejen de experimentar con la IA y la pongan a trabajar en producción.

Samsung Electronics inicia el envío de muestras del primer HBM4E de la industria

El HBM4E de 12 capas de Samsung alcanza velocidades de hasta 16Gbps con mayor eficiencia energética y mejor desempeño térmico.

AI Vision Companion: Samsung apuesta por la nueva experiencia en televisores

AI Vision Companion es la nueva experiencia impulsada por inteligencia artificial de Samsung llega para transformar la forma en que se ve contenido.

Motorola: Historia, innovación y una de las marcas más reconocidas del mundo

Motorola no es simplemente una marca de móviles: es una de las compañías que ayudó a construir la industria de las comunicaciones tal y como la conocemos hoy.
BigBuda
ESET Security Day 2026
Agencia BigBuda
spot_img
Beatriz Arévalo
Beatriz Arévalohttps://www.zoomtecnologico.com
Redactora y colaboradora de Zoom Tecnológico.
spot_imgspot_img

ChatGPT vs Gemini: ¿cuál es mejor para productividad en 2026?

ChatGPT vs Gemini depende mucho del tipo de usuario y del ecosistema digital que cada persona utiliza diariamente.

¿Cómo salir en respuestas IA?: Estrategias para aparecer en buscadores inteligentes

Salir en respuestas IA se está convirtiendo en una nueva fuente de tráfico y visibilidad digital.

Aparecer en respuestas de ChatGPT, Gemini o Perplexity ya es clave para las empresas chilenas

Cada vez más personas buscan información usando ChatGPT, Gemini o Perplexity en lugar de Google antes de tomar decisiones de compra.