El 1 de junio de 2026, Google desconectó dos modelos de su API: gemini-2.0-flash-001 y gemini-2.0-flash-lite-001. Cualquier aplicación que los llamara desde esa fecha recibe error. No hay periodo de gracia.
Si aún no migraste, el fix es cambiar el ID del modelo en tu código. Nada más. Pero antes de hacerlo, conviene entender qué llegó en su lugar — y si el nuevo precio tiene sentido para tu caso.
Qué pasó exactamente
Google anunció la depreciación de Gemini 2.0 Flash con semanas de anticipación. La fecha de corte fue real: 1 de junio de 2026. Eso incluyó gemini-2.0-flash-001, gemini-2.0-flash-lite-001 y sus respectivos endpoints de Provisioned Throughput.
La razón: tres semanas antes, el 19 de mayo en Google I/O 2026, Google lanzó Gemini 3.5 Flash. No una actualización incremental — el primer modelo de la familia 3.5, con un salto de rendimiento que hace al 2.0 directamente obsoleto.
Gemini 3.5 Flash: lo que cambió
El nuevo Flash no compite con el Flash anterior. Compite — y supera — al Pro del año pasado en las tareas que más importan a desarrolladores.
En MCP Atlas obtuvo 83.6% y en GDPval-AA alcanzó 1,656 Elo. La velocidad también subió: Google reporta que es cuatro veces más rápido que otros modelos frontier en tokens por segundo.
El precio sí subió — y es el punto que más importa
Gemini Flash siempre fue la opción económica. Eso cambió con 3.5:
| Modelo | Input / 1M tokens | Output / 1M tokens |
|---|---|---|
| gemini-2.0-flash-001 | $0.10 | $0.40 |
| gemini-3.0-flash | $0.50 | $3.00 |
| gemini-3.5-flash (nuevo) | $1.50 | $9.00 |
| gemini-3.1-pro | $2.50 | $15.00 |
El nuevo Flash cuesta 3× más que la generación anterior. Sigue siendo 40% más barato que el Pro, pero si construiste tu calculadora de costos con precios de Flash 3.0, el número ya no aplica.
Cómo migrar: es solo cambiar el ID
Google mantuvo la interfaz del SDK idéntica. La migración es una línea de código:
# Antes (ya no funciona)
model = "gemini-2.0-flash-001"
# Ahora — rendimiento Pro del año pasado, a precio Flash
model = "gemini-3.5-flash"
# Alternativa económica si el 3× de costo no justifica
model = "gemini-3.1-flash-lite"
Sin cambios en la estructura del request. Sin actualizaciones de SDK requeridas.
¿Cuál elegir?
- Procesamiento de texto a volumen, donde el costo era clave: evalúa
gemini-3.1-flash-liteprimero. Es la opción más económica disponible hoy. - Código, agentes o tareas largas:
gemini-3.5-flashjustifica el precio — supera al Pro del año pasado a menor costo. - Aplicaciones que usaban Flash por velocidad: 3.5 Flash es más rápido y más capaz. Es el upgrade directo.
Lo que dice esto del ritmo del mercado
Google retiró un modelo masivamente adoptado tres semanas después de lanzar su reemplazo. Esto no es un accidente editorial — es la señal de cómo va a operar el ciclo de versiones de aquí en adelante.
Los equipos que construyen sobre APIs de IA necesitan asumir ciclos de 6–12 meses por modelo, no años. La dependencia en una versión fija sin monitoreo de deprecaciones es deuda técnica con fecha de vencimiento conocida.
Un dato más: Gemini 3.5 Pro está anunciado para antes de que termine el mes. Cuando llegue, el panorama de precios y rendimiento vuelve a moverse.