
Anthropic lanza su nuevo modelo de IA, el mejor del mundo en situaciones inéditas

La startup estadounidense Anthropic anunció el lunes el lanzamiento de su nuevo modelo de inteligencia artificial (IA) generativa, Claude Sonnet 4.5, calificado como el mejor del mundo a la hora de enfrentar situaciones inéditas.
Esta nueva generación de grandes modelos de lenguaje (LLM) puede funcionar de forma autónoma durante 30 horas seguidas una vez que se le asigna una tarea, mientras que la versión más potente de Anthropic hasta la fecha, Claude 4 Opus, solo aguantaba 7 horas.
Los programas de IA generativa pueden funcionar solos durante varias horas, ya que evalúan regularmente su propia producción y realizan cambios así como correcciones.
Claude Sonnet 4.5 obtuvo la mejor puntuación tras ser sometido al sistema de evaluación independiente SWE-Bench Verified, desarrollado por investigadores de las universidades estadounidenses de Princeton y Stanford.
Anthropic fue creada a principios de 2021 por exempleados de OpenAI que consideraban que su antigua empresa no hacía lo suficiente para controlar y prevenir posibles errores de sus modelos.
Desde noviembre de 2022 y con la llegada de ChatGPT (basado en el modelo GPT-3.5) de OpenAI, los grandes actores de la IA generativa se han lanzado a una carrera frenética, en la que cada semana aparecen nuevos modelos con capacidades más grandes.
Si bien Anthropic había sido considerada durante varios meses como la más eficaz en materia de IA generativa de código informático, recientemente OpenAI ha recuperado terreno.
Su último asistente, GPT-5, lanzado a principios de agosto, se encontraba a la cabeza de algunas clasificaciones de IA.
Claude Sonnet 4.5 es también, según Anthropic, el modelo más avanzado para desarrollar agentes de IA capaces de tomar decisiones en situaciones inéditas ("agentes del mundo real"), para las que no han sido programados.
La nueva versión de Anthropic también es la más sofisticada para aplicaciones que permiten a un asistente de IA utilizar una computadora como lo haría un humano.
Ante un pedido en lenguaje coloquial, la interfaz puede realizar una búsqueda en Google o llevar a cabo trámites en línea utilizando información extraída de la computadora.
Esta nueva funcionalidad fue propuesta por primera vez por Anthropic en octubre de 2024.
OpenAI lanzó un producto equivalente, Operator, en enero de 2025. En marzo le siguió Manus, creado por investigadores chinos, y luego el Proyecto Mariner de Google, en mayo.
N.Carrasco--HdM