El 1 de junio de 2026, Google desconectó dos modelos de su API: gemini-2.0-flash-001 y gemini-2.0-flash-lite-001. Cualquier aplicación que los llamara desde esa fecha recibe error. No hay periodo de gracia.

Si aún no migraste, el fix es cambiar el ID del modelo en tu código. Nada más. Pero antes de hacerlo, conviene entender qué llegó en su lugar — y si el nuevo precio tiene sentido para tu caso.

Qué pasó exactamente

Google anunció la depreciación de Gemini 2.0 Flash con semanas de anticipación. La fecha de corte fue real: 1 de junio de 2026. Eso incluyó gemini-2.0-flash-001, gemini-2.0-flash-lite-001 y sus respectivos endpoints de Provisioned Throughput.

La razón: tres semanas antes, el 19 de mayo en Google I/O 2026, Google lanzó Gemini 3.5 Flash. No una actualización incremental — el primer modelo de la familia 3.5, con un salto de rendimiento que hace al 2.0 directamente obsoleto.

Gemini 3.5 Flash: lo que cambió

El nuevo Flash no compite con el Flash anterior. Compite — y supera — al Pro del año pasado en las tareas que más importan a desarrolladores.

76.2% en Terminal-Bench 2.1 — supera a Gemini 3.1 Pro en tareas de código y agentes.
1M tokens de contexto. Equivale a cientos de páginas de documentos o repositorios completos de código procesados en una sola llamada.

En MCP Atlas obtuvo 83.6% y en GDPval-AA alcanzó 1,656 Elo. La velocidad también subió: Google reporta que es cuatro veces más rápido que otros modelos frontier en tokens por segundo.

El precio sí subió — y es el punto que más importa

Gemini Flash siempre fue la opción económica. Eso cambió con 3.5:

Modelo Input / 1M tokens Output / 1M tokens
gemini-2.0-flash-001 $0.10 $0.40
gemini-3.0-flash $0.50 $3.00
gemini-3.5-flash (nuevo) $1.50 $9.00
gemini-3.1-pro $2.50 $15.00

El nuevo Flash cuesta 3× más que la generación anterior. Sigue siendo 40% más barato que el Pro, pero si construiste tu calculadora de costos con precios de Flash 3.0, el número ya no aplica.

Cómo migrar: es solo cambiar el ID

Google mantuvo la interfaz del SDK idéntica. La migración es una línea de código:

# Antes (ya no funciona)
model = "gemini-2.0-flash-001"

# Ahora — rendimiento Pro del año pasado, a precio Flash
model = "gemini-3.5-flash"

# Alternativa económica si el 3× de costo no justifica
model = "gemini-3.1-flash-lite"

Sin cambios en la estructura del request. Sin actualizaciones de SDK requeridas.

¿Cuál elegir?

  • Procesamiento de texto a volumen, donde el costo era clave: evalúa gemini-3.1-flash-lite primero. Es la opción más económica disponible hoy.
  • Código, agentes o tareas largas: gemini-3.5-flash justifica el precio — supera al Pro del año pasado a menor costo.
  • Aplicaciones que usaban Flash por velocidad: 3.5 Flash es más rápido y más capaz. Es el upgrade directo.

Lo que dice esto del ritmo del mercado

Google retiró un modelo masivamente adoptado tres semanas después de lanzar su reemplazo. Esto no es un accidente editorial — es la señal de cómo va a operar el ciclo de versiones de aquí en adelante.

Los equipos que construyen sobre APIs de IA necesitan asumir ciclos de 6–12 meses por modelo, no años. La dependencia en una versión fija sin monitoreo de deprecaciones es deuda técnica con fecha de vencimiento conocida.

Un dato más: Gemini 3.5 Pro está anunciado para antes de que termine el mes. Cuando llegue, el panorama de precios y rendimiento vuelve a moverse.