
Piensa por un momento en los modelos de inteligencia artificial que has utilizado en los últimos días. Quizás esto se haya hecho a través de ChatGPT, Gemini o Claude, o quizás mediante herramientas como Codex, Claude Code o Cursor AI. En la práctica, la elección suele ser sencilla: acabamos utilizando lo que mejor se adapta a lo que necesitamos en cada momento, casi sin pensar en la tecnología que hay detrás.
Sin embargo, este equilibrio cambia con frecuencia. Cada nuevo modelo que surge promete mejoras, nuevas capacidades o diferentes formas de trabajar, lo que inmediatamente plantea la pregunta: si vale la pena probarlo, si realmente puede ofrecernos algo mejor o si lo que ya estamos usando todavía es suficiente. Claude Sonnet 4.6 acaba de salir a la luzy así se posiciona frente a la competencia.
El punto de partida de Claude Sonnet 4.6. Aquí encontramos lo que Anthropic describe como una mejora transversal de habilidades que incluye avances en codificación, uso de computadoras, pensamiento de contexto largo, planificación de agentes y tareas propias del trabajo intelectual y creativo. A este conjunto se agrega una ventana de contexto con hasta un millón de tokens en versión beta, diseñada para manejar bases de código completas, grandes contratos o grandes colecciones de información sin fragmentación.
Tres niveles, el mismo mapa. Para entender dónde encaja Sonnet 4.6, vale la pena echar un vistazo a cómo Anthropic tiende a organizar su familia de modelos en diferentes niveles con diferentes objetivos. Haiku enfatiza la velocidad y la eficiencia, Opus se reserva para tareas que requieren una reflexión profunda y Sonnet toma el término medio, diseñado para equilibrar la capacidad y los costos operativos. En este marco, la compañía afirma que el nuevo Sonnet se acerca al rendimiento anteriormente asociado al Opus en algunas tareas del mundo real, una afirmación ambiciosa.
Cuando la IA comienza a usar la computadora. Una de las mejoras que más destaca Anthropic en Sonnet 4.6 es el avance en lo que llama Uso de la computadoraes decir, la capacidad del modelo para interactuar con el software de forma similar a una persona, sin depender de API diseñadas específicamente para la automatización. Este avance está avalado por referentes como OSWorld-Verified, un entorno de pruebas con aplicaciones reales en el que la familia Sonnet se ha ido mejorando continuamente a lo largo de varios meses. La empresa también reconoce limitaciones y riesgos de los que hablamos anteriormente, como los intentos de manipulación. inyección inmediata.
Buscando el “mejor” modelo. En este punto, la pregunta ya no es cuánto ha mejorado el Sonnet 4.6 en términos absolutos, sino cómo se compara con otros modelos grandes que compiten por el mismo espacio utilizable en la actualidad. La comparación no es fácil ni permite encontrar un único ganador, ya que cada sistema brilla en diferentes áreas y responde a diferentes prioridades técnicas. Por eso es recomendable leerlos. Estándares con ojo práctico para descubrir en qué tareas específicas se producen las diferencias reales.
Donde cada modelo destaca. La comparación directa con GPT-5.2 muestra más una distribución de fuerzas que una clara victoria. Según la tabla publicada por Anthropic, Sonnet 4.6 destaca con especial claridad en el uso autónomo del ordenador, según lo medido por OSWorld-Verified, mostrando una ventaja en tareas de oficina (GDPval-AA Elo) y en algunos escenarios de análisis o resolución de problemas (Finance Agent v1.1, ARC-AGI-2). GPT-5.2, por su parte, consigue mejores resultados en razonamiento de posgrado (GPQA Diamond), comprensión visual (MMMU-Pro) y programación de terminales (Terminal-Bench 2.0), con matices como los resultados marcados como “Pro” en algunas pruebas.
La comparación con Gemini 3 Pro introduce un matiz diferente, porque aquí las ventajas se concentran principalmente en las áreas de razonamiento y conocimiento general. El modelo de Google obtiene mejores resultados en pruebas de razonamiento lógico a nivel de posgrado (GPQA Diamond) y cuestionarios multilingües de amplio alcance (MMMMLU), y también es líder en razonamiento visual sin herramientas (MMMU-Pro). Sonnet 4.6, por otro lado, conserva algunas ventajas cuando entran en juego herramientas externas o escenarios más cercanos al trabajo aplicado. En cualquier caso, la ausencia de algunos datos comparables en la propia tabla obliga a interpretar este duelo con cautela.
Dónde se puede utilizar Sonnet 4.6. El nuevo modelo está disponible en todos los planes de Claude, incluida la versión gratuita, donde también se convierte en la opción predeterminada en claude.ai y Claude Cowork. También se puede utilizar a través de Claude Code, la API y las principales plataformas en la nube manteniendo el mismo precio que la versión Sonnet 4.5.
Después de pasar por posibilidades, límites y comparaciones, la decisión real vuelve a la vida cotidiana del usuario. Se dice que Sonnet 4.6 es particularmente útil para tareas productivas, interacción directa con software y flujos de trabajo prolongados, mientras que GPT-5.2 y Gemini 3 Pro mantienen ventajas en razonamiento académico, comprensión visual o conocimiento general, según la prueba considerada. Nadie domina todos los frentes y esta fragmentación dice mucho sobre el estado actual de la IA.
Imágenes | Antropoceno
En | En 2025, la IA parecía haber topado con un muro de progreso. Un muro evaporado en febrero de 2026
En | La gran revolución de GPT-5.3 Codex y Claude Opus 4.6 no es que sean más inteligentes. Se trata de que puedan mejorar.