Google发布Gemini 2.5 Flash：实现更灵活的思维控制

Detalles del contenido

En un mundo en el que la tecnología y el conocimiento están entrelazados, cada lectura es como una aventura asombrosa que te da una sensación de sabiduría e inspira una creatividad sin fin.

Google lanza Gemini 2.5 Flash: permite controles mentales más flexibles

En la feroz competencia en el campo de la inteligencia artificial, Google ha vuelto a reescribir las reglas del juego con una innovación disruptiva. El recientemente lanzado Gemini 2.5 Flash no sólo continúa con el potente rendimiento de su modelo insignia, sino que también logra el equilibrio definitivo entre coste y eficiencia gracias a la revolucionaria "Arquitectura de razonamiento híbrida" y al mecanismo "Pensar bajo presupuesto". Este avance marca la entrada formal del desarrollo de IA en la era del "pensamiento bajo demanda", proporcionando a empresas y desarrolladores una flexibilidad y rentabilidad sin precedentes.

ShirtAI permite el uso gratuito e ilimitado de Gemini-2.0-flash, Gemini-2.5-pro y otros modelos, con un solo clic en el sitio web oficial:www.lsshirtai.com

I. Alboroto por el rendimiento: redefinir los límites de la codificación y el razonamiento

1. Prueba del tablero Galton: rendimiento asombroso que aplasta a OpenAI

El Gemini 2.5 Flash demostró su asombrosa destreza en la reciente y controvertida prueba de simulación física del tablero de Galton. La tarea requería que el modelo simulara con precisión la trayectoria de una pequeña bola a través de un tablero de obstáculos de varias capas y, en última instancia, presentara un resultado con distribución normal. Prueba en curso:

- - Gemini 2.5 Flash reproduce a la perfección las leyes de la física en sólo 5 indicaciones, generando una animación suave y natural que se ajusta perfectamente a las reglas de la física real.
  - Los modelos de OpenAI, como GPT-4o mini y O3-mini, fallaron debido a su incapacidad para manejar interacciones físicas complejas, e incluso cometieron errores de bajo nivel, como solapamiento de manchas y anomalías de distribución.
  - Jeff Dean, científico jefe de Google, elogió personalmente los resultados de la prueba, calificándola de "avance sísmico en la potencia de codificación".

II. Núcleo tecnológico: la arquitectura híbrida de razonamiento y la revolución del "presupuesto pensante"

1. Modelos de inferencia híbridos: un doble avance en rendimiento y eficacia

La principal innovación de Gemini 2.5 Flash es su arquitectura de razonamiento híbrida, un modelo informático dinámico que equilibra la velocidad de razonamiento y la precisión. A diferencia de los modelos tradicionales que piensan a toda velocidad, Gemini 2.5 Flash permite a los desarrolladores asignar de forma flexible el Presupuesto de Pensamiento, que es el número de fichas que utiliza el modelo para el razonamiento interno antes de generar una respuesta, en función de la complejidad de la tarea. Este mecanismo se rompe por:

Coste controlable: cuando se desactiva el pensamiento, el coste de inferencia desciende a 0,6 $/millón de fichas (1/6 de modelos similares), y el rendimiento se acerca a Pro cuando se activa el presupuesto de pensamiento más alto (24.000 tokens).
Adaptación dinámica: el modelo ajusta automáticamente la profundidad del pensamiento en función de la dificultad de la tarea. Por ejemplo, sólo se necesitan unos cientos de fichas para completar el razonamiento en problemas matemáticos sencillos, mientras que pueden consumirse decenas de miles de fichas para perseguir una precisión extrema en análisis científicos complejos.

2. Prueba Arena: aplastamiento exhaustivo de modelos similares

En la clasificación de arenas de la plataforma de análisis de terceros Imarena, Gemini 2.5 Flash ocupa el segundo puesto con una puntuación Elo de 1392 puntos. en segundo lugar, empatado con los mejores modelos como GPT-4.5 y Grok-3, y significativamente mejor que Claude 3.7 Sonnet (1340 puntos) y DeepSeek R1 (1358 puntos). Sus puntos fuertes son:

Generación de código: 63,5% en la prueba LiveCodeBench V5 (cercano al 70,6% de DeepSeek R1).
Razonamiento matemático: en la simulación del concurso de matemáticas AIME 2025, obtuvo 78,01 TP3T en un solo intento lo que supera los 27,51 TP3T de Claude 3.7 Sonnet.
Prueba de conocimientos: El último examen de la humanidad con 12,11 TP3T sólo superado por O4-mini (14,31 TP3T).

III. Manía de los desarrolladores: salto de eficiencia y revolución de costes

1. Experiencia de desarrollo rápido: del prototipo a la realidad en unas pocas líneas de código

Los desarrolladores ya están aprovechando la flexibilidad de Gemini 2.5 Flash para completar proyectos complejos:

- Simulación física: el internauta @RameshR genera animaciones de placas de Galton con distribución normal en sólo 5 indicaciones, mientras que el modelo de OpenAI falla debido a fallos del motor de física.
- Desarrollo web: las interfaces de imitación de YouTube y Spotify del desarrollador @Taro Bushidō son elogiadas por su "restauración pixel-perfect de los diseños oficiales".
- Agentes de IA: cree agentes de protocolo MCP para acceder a Airbnb y Google Maps en sólo 30 líneas de código Python.

2. Comparación de costes: una "revolución precio/rendimiento" en IA

La siguiente tabla compara visualmente la estrategia de precios de Gemini 2.5 Flash con otros modelos (basada en millones de entradas y salidas de fichas):

modelización	Coste de entrada ($/millón de fichas)	Coste de producción (razonamiento off)	Coste de producción (razonamiento)
Gemini 2.5 Flash	$0.15	$0.60	$3.50
GPT-4o Mini	$0.10	$1.10	$4.40
Claude 3.7 Soneto	$3.00	$15.00	–
DeepSeek R1	$3.00	$15.00	–

Nota: Con una relación de 3:1 entre entradas y salidas, el coste combinado del Gemini 2.5 Flash es sólo 1/30 del Claude 3.7.

El lanzamiento de Gemini 2.5 Flash marca el inicio del paso de los modelos de IA de "juguetes de laboratorio" a "herramientas de productividad". Su arquitectura de inferencia híbrida no sólo resuelve la contradicción entre coste y rendimiento, sino que también insinúa la futura dirección de la evolución de la IA: hacer realidad infinitas posibilidades con una aritmética limitada. A medida que Google siga iterando (como el próximo plug-in de generación de vídeo), esta revolución rentable liderada por Gemini puede remodelar el panorama mundial del desarrollo de la IA.

Si desea utilizar GPT Plus, Claude Pro, Grok Super cuenta exclusiva oficial de pago, puede ponerse en contacto con nuestro equipo profesional (wx: abch891) si no sabe cómo recargar su cuenta.

Para más productos, visite	Más información en
ShirtAI - Inteligencia penetrante	El Gran Modelo AIGC: el comienzo de una era de doble revolución en ingeniería y ciencia - Inteligencia Penetrante
Restauración 1:1 de Claude y GPT Sitio web oficial - AI Cloud Native	Live Match App Global HD Sports Viewing Player (Recomendado) - Blueshirt Technology
Servicio de tránsito basado en la API oficial - GPTMeta API	Ayuda, ¿alguien de ustedes puede proporcionar algunos consejos sobre cómo hacer preguntas en GPT? - Conocimientos
Tienda digital global de bienes virtuales - Global SmarTone (Feng Ling Ge)	¿Qué tan poderoso es Claude airtfacts característica que GPT al instante no huele bien? -BeepBeep

categorías.

Boletín

espacio publicitario

¡Presenciemos juntos la supermagia de la IA!

Adopte su asistente de inteligencia artificial y aumente su productividad con un solo clic.