La nueva guerra por la IA no se centrará exclusivamente en modelos como Gemini, ChatGPT o Claude: el siguiente paso es lograr una IA local capaz de actuar como un humano. Es la IA agéntica (usuarios/agentes digitales)
¿Qué es?
-
- Autonomía y Acción: No solo responde preguntas, sino que ejecuta tareas de principio a fin, como organizar una reunión, gestionar un correo o navegar por software de empresa.
- Capacidad de Razonamiento:
Analiza situaciones, desarrolla estrategias y aprende de sus interacciones para mejorar con el tiempo
- Componentes Principales: Funciona mediante sensores (recolección de datos), un «cerebro» (LLM para razonamiento) y efectores (APIs/herramientas para ejecutar acciones).
- Diferencia con IA Generativa: Mientras la generativa crea contenido basado en un prompt, la agéntica recibe un objetivo final y decide autónomamente cómo llegar a él.
Mientras la IA generativa crea contenido, la IA agéntica recibe un objetivo final y decide autónomamente cómo llegar a él
Moltbot, UI-TARS, Kimmi K2.5 … Aunque la IA agéntica suene lejana, la guerra por lograr que forme parte de nuestro día a día lleva años gestándose.
Los usuarios que interactúan ya no son humanos. Estos “agentes” toman decisiones, no solo automatismos, se colocan cada vez más encima del árbol de decisiones…En redes “sociales” como Moltbot ocurre que los robots son los usuarios. La plataforma adopta una estructura similar a la de Reddit, con hilos de discusión y un sistema de votos positivos y negativos. Los bots de inteligencia artificial (IA) pueden publicar, comentar y votar. “Una red social para agentes de IA”, se lee al acceder, “los humanos son bienvenidos a observar”.
El fenómeno de finales de enero ha sido Molbot, anteriormente conocido como Clawdbot. Se trata de uno de los agentes de IA más potentes del momento, hasta el punto de que advierte de sus propios riesgos incluso antes de ser instalado. Un agente que parecía no tener competidor y ser único en su especie. Estábamos equivocados.
Aunque no ha hecho tanto ruido, en abril de 2025 se lanzó UI-TARS-1.5, un agente multimodal de código abierto capaz de realizar todo tipo de tareas dentro de entornos de escritorio. UI-TARS-1.5 es un agente multimodal diseñado para interactuar con el mundo digital a través de interfaces gráficas, usando la propia pantalla, ratón y teclado.
Venía a manos de Bytedance, empresa tras gigantes como TikTok y uno de los principales jugadores en el desarrollo de la inteligencia artificial en China.
UI-TARS es un agente de IA diseñado para usar un ordenador como lo haría una persona. Ve la pantalla, identifica elementos visuales y actúa mediante ratón y teclado.
A diferencia de Moltbot, no ejecuta código ni comandos directamente en el sistema, sino que interactúa con el PC desde fuera, a nivel de interfaz. Es más seguro por diseño, porque no puede romper el sistema ejecutando código arbitrario. Además, razona antes de cada acción, lo que reduce errores acumulados en tareas largas.
Qué puede hacer. UI-TARS interactúa «hablando» con tu ordenador. Es capaz de ejecutar tareas en nuestra interfaz analizando lo que hay en ella.
- Sirve como asistente de programación.
- Puede comportarse como un humano para probar apps.
- Funciona como tutor para realizar tareas complejas.
- Puede gestionar tareas de escritorio y gestión del PC.
El 5 de febrero de 2026, Anthropic lanzó Claude Opus 4.6, la versión más avanzada de su modelo de lenguaje insignia, diseñada específicamente para ampliar su atractivo entre equipos empresariales y founders que necesitan capacidades avanzadas de código, planificación agéntica y gestión de contextos extensos.
Este lanzamiento representa un salto cualitativo respecto a Claude Opus 4.5 (noviembre 2025), con mejoras concretas en tareas de desarrollo de software, operación autónoma sobre repositorios completos y la capacidad de coordinar flujos de trabajo complejos de manera autónoma, sin intervención humana constante.
