Panorama actualizado (septiembre 2025) de los principales modelos de IA para programación 1. Claude 4 (Opus & Sonnet) Variante Tamaño (equivalente) Lanzamiento Qué lo diferencia Opus ≈ 200 B parámetros (arquitectura Claude‑4‑XL) 14 feb 2025 Máxima capacidad de razonamiento de cadena de pensamiento, menor tasa de “hallucinations”, soporte avanzado de *tool‑use* (puede invocar APIs externas). Sonnet ≈ 80 B parámetros (Claude‑4‑L) 14 feb 2025 Compromise entre calidad y coste; 2‑3× más barato que Opus y suficiente para la mayoría de tareas de código, documentación y QA. Principales ventajas para programadores Razonamiento paso‑a‑paso: Muy bueno en Chain‑of‑Thought y en descomposición de problemas algorítmicos (HumanEval ≈ 84 % de éxito, MBPP ≈ 87 %). Control de “Safety”: Menor generación de código inseguro o que exponga datos confidenciales. Tool‑use nativo: Puede ejecutar comandos en el entorno sandbox…