Comparativa de las 10 principales IA: 12 de marzo vs 26 de marzo de 2026
Esta comparación muestra cómo cambiaron las calificaciones entre el 12 de marzo de 2026 y el 26 de marzo de 2026.
Leyenda: verde = subió, rojo = bajó, negro = se mantuvo igual.
Nota metodológica: el cuadro del 26 de marzo reemplazó Costo y Velocidad por Búsqueda web y Productividad. Por eso, la comparación exacta se hace solo sobre las 8 métricas comunes y el promedio, con una leve salvedad en este último.
Tabla comparativa
| IA | Desarrollo | Agentes | Investigación | Redacción | Datos/BI | Multimodal | Razonamiento | Empresa | Promedio* |
|---|---|---|---|---|---|---|---|---|---|
| ChatGPT (OpenAI) | 9.5 -> 9.3 | 9.5 -> 9.7 | 9.6 -> 9.7 | 9.3 -> 9.3 | 9.2 -> 9.2 | 9.7 -> 9.7 | 9.5 -> 9.6 | 9.1 -> 9.2 | 9.1 -> 9.4 |
| Claude (Anthropic) | 9.8 -> 9.8 | 9.3 -> 9.2 | 8.8 -> 8.9 | 9.6 -> 9.7 | 8.9 -> 8.9 | 8.4 -> 8.6 | 9.6 -> 9.7 | 9.0 -> 9.1 | 9.0 -> 9.2 |
| Gemini (Google) | 9.2 -> 9.4 | 9.0 -> 8.9 | 9.4 -> 9.5 | 9.1 -> 9.1 | 9.0 -> 9.1 | 9.5 -> 9.8 | 9.4 -> 9.6 | 9.1 -> 9.2 | 9.1 -> 9.4 |
| Microsoft Copilot | 8.8 -> 8.4 | 9.2 -> 9.2 | 8.9 -> 9.1 | 8.8 -> 8.9 | 9.4 -> 9.5 | 8.4 -> 8.4 | 8.9 -> 9.0 | 9.8 -> 9.9 | 8.8 -> 9.1 |
| Grok (xAI) | 8.7 -> 8.8 | 8.7 -> 9.0 | 8.3 -> 8.6 | 8.3 -> 8.4 | 8.0 -> 8.1 | 8.8 -> 8.8 | 9.1 -> 9.2 | 7.8 -> 7.9 | 8.4 -> 8.7 |
| Perplexity | 7.5 -> 7.6 | 8.4 -> 8.6 | 9.5 -> 9.7 | 8.5 -> 8.6 | 8.6 -> 8.7 | 7.8 -> 8.0 | 8.7 -> 8.8 | 8.3 -> 8.4 | 8.5 -> 8.7 |
| Meta AI | 6.8 -> 6.9 | 7.2 -> 7.3 | 7.6 -> 7.4 | 8.4 -> 8.3 | 7.3 -> 7.2 | 8.9 -> 9.0 | 8.1 -> 8.0 | 6.8 -> 6.8 | 7.9 -> 7.7 |
| Mistral (Le Chat) | 8.2 -> 8.9 | 8.8 -> 8.9 | 8.0 -> 8.3 | 8.2 -> 8.3 | 8.1 -> 8.2 | 8.0 -> 8.1 | 8.5 -> 8.7 | 9.0 -> 9.0 | 8.4 -> 8.5 |
| DeepSeek | 8.6 -> 8.9 | 8.2 -> 8.5 | 7.8 -> 7.9 | 8.0 -> 8.1 | 8.2 -> 8.3 | 7.4 -> 7.5 | 9.0 -> 9.2 | 6.9 -> 7.0 | 8.2 -> 8.1 |
| Amazon Q | 8.9 -> 9.0 | 8.9 -> 8.9 | 8.2 -> 8.1 | 8.0 -> 8.0 | 9.3 -> 9.4 | 6.8 -> 7.0 | 8.4 -> 8.5 | 9.7 -> 9.8 | 8.5 -> 8.5 |
Lectura rápida
- Los que más mejoraron de forma general: ChatGPT, Gemini, Microsoft Copilot y Grok.
- El salto más visible en una métrica individual fue Mistral en Desarrollo (8.2 -> 8.9).
- Los que peor quedaron en el promedio fueron Meta AI y DeepSeek, aunque en DeepSeek influye el cambio metodológico del cuadro.