• 1/11/2025

GPT-5 y Claude, las IA que ya igualan el trabajo humano en 44 profesiones, según OpenAI

En el 40% de las profesiones analizadas, modelos de IA como ChatGPT-5 y Claude demostraron un nivel igual o mayor al humano. Lista completa de profesiones
Por Z.L.L
26/09/2025 - 09:25hs
IA reemplaza trabajo humano

Un estudio que OpenAI dio a conocer esta semana evaluó que los modelos de lenguaje avanzado como ChatGPT-5 y Claude han demostrado un desempeño comparable al de los profesionales humanos en una amplia gama de tareas laborales, marcando un hito en la integración de la Inteligencia Artificial (IA) en el ámbito profesional.

Este avance sugiere que la IA no solo está destinada a la automatización de tareas repetitivas, sino que se está convirtiendo en un colaborador o "copiloto" capaz de igualar la calidad del trabajo de un experto en diversas ocupaciones.

La noticia llegó el día después de que Sam Altman, fundador de OpenAI, declarara que algunas profesiones están siendo desplazadas de plano por la tecnología. 

Durante su participación en The Tucker Carlson Show, Altman fue contundente: el servicio de atención al cliente, tanto telefónico como online, es el sector que más rápido está siendo transformado. "Estoy seguro de que esas personas perderán su trabajo y una IA lo hará mejor", aseguró

IA al nivel humano

OpenAI lanzó un marco de evaluación llamado GDPval para medir el desempeño de los modelos de IA en tareas laborales del mundo real. Los modelos evaluados fueron GPT‑4o, o4-mini, OpenAI o3, GPT‑5, Claude Opus 4.1, Gemini 2.5 Pro, y Grok 4.

Este enfoque va más allá de los benchmarks académicos tradicionales, solicitando a los modelos la creación de entregables complejos como documentos, presentaciones de diapositivas y código, simulando un entorno de trabajo genuino.

El estudio se centró en la comparación directa, donde profesionales humanos con experiencia evaluaron y calificaron los informes generados por los modelos de IA frente a los elaborados por otros expertos humanos.

El análisis arrojó resultados sorprendentes sobre la capacidad de los modelos más avanzados:

  • GPT-5 High: Una versión potenciada de GPT-5, logró una tasa de éxito notable. En el 40% de las 44 ocupaciones analizadas, su desempeño fue calificado como igual o superior al de los profesionales humanos.
  • Claude Opus 4.1 (Anthropic): Este modelo también demostró ser un competidor feroz, alcanzando una tasa de éxito del 49%, superando incluso a la versión de GPT-5 High en la evaluación general.

Estos resultados indican que, en muchas áreas, la diferencia entre la producción de la IA y la de un profesional no es discernible para los evaluadores expertos.

Lista completa de profesiones evaluadas

OpenIA dio a conocer en su paper cuáles fueron las profesiones evaluadas para este estudio. Las mismas fueron elegidas por su aporte al Producto Bruto Interno (GDP, por sus siglas en inglés) de Estados Unidos. 

Las 44 profesiones se agrupan en 9 industrias y son las siguientes: 

1. Servicios Profesionales, Científicos y Técnicos

  • Desarrolladores de Software
  • Abogados
  • Contadores y Auditores
  • Gerentes de Sistemas de Computación e Información
  • Especialistas en Gestión de Proyectos

2. Finanzas y Seguros

  • Representantes de Servicio al Cliente
  • Analistas Financieros y de Inversión
  • Gerentes Financieros
  • Asesores Financieros Personales
  • Agentes de Ventas de Valores, Productos Básicos y Servicios Financieros

3. Asistencia Sanitaria y Social

  • Enfermeros Registrados
  • Enfermeros Practicantes (Nurse Practitioners)
  • Gerentes de Servicios Médicos y de Salud
  • Supervisores de primera línea de trabajadores de apoyo administrativo y de oficina
  • Secretarios Médicos y Asistentes Administrativos

4. Comercio al por Menor 

  • Farmacéuticos
  • Supervisores de primera línea de trabajadores de ventas al por menor
  • Gerentes Generales y de Operaciones
  • Detectives e Investigadores Privados

5. Inmobiliario y Alquiler 

  • Encargados
  • Gerentes de Propiedades, Bienes Raíces y Asociaciones Comunitarias
  • Agentes de Ventas de Bienes Raíces
  • Corredores de Bienes Raíces (Brokers)
  • Empleados de Mostrador y Alquiler

6. Gobierno

  • Trabajadores de Recreación
  • Oficiales de Cumplimiento (Compliance)
  • Supervisores de primera línea de policía y detectives
  • Gerentes de Servicios Administrativos
  • Trabajadores Sociales y Escuelas

7. Información

  • Técnicos de Audio y Video
  • Productores y Directores
  • Analistas de Noticias, Reporteros y Periodistas
  • Editores de Cine y Video
  • Editores (de textos)

8. Comercio al por Mayor

  • Gerentes de Ventas
  • Empleados de Pedidos
  • Supervisores de primera línea de trabajadores de ventas no minoristas
  • Representantes de Ventas, al por mayor y de fabricación (excepto productos técnicos y científicos)
  • Representantes de Ventas, al por mayor y de fabricación (productos técnicos y científicos)

9. Manufactura

  • Ingenieros Mecánicos
  • Ingenieros Industriales
  • Compradores y Agentes de Compras
  • Empleados de Envío, Recepción e Inventario
  • Supervisores de primera línea de trabajadores de producción y operación

Implicaciones en el mercado laboral

El nombre del marco, GDPval, hace referencia a la intención de medir el efecto en el Producto Interno Bruto (PIB). El estudio completo de OpenAI se puede conocer aquí.

La posibilidad de que la IA pueda igualar o incluso superar el rendimiento humano en tantas tareas tiene implicaciones significativas:

  • Aumento de la productividad: Los resultados sugieren que los profesionales podrán delegar una porción considerable de sus tareas a modelos de IA, permitiéndoles dedicar más tiempo a actividades de mayor valor, pensamiento estratégico y toma de decisiones complejas.
  • Nuevos roles y capacidades: En lugar de la sustitución masiva, se espera una redefinición de roles. Los profesionales que dominen la interacción con la IA, utilizando estos modelos como "copilotos", serán los que obtengan la mayor ventaja competitiva.
  • Valor de la precisión y la estética: El estudio destacó que GPT-5 sobresalió particularmente en la precisión y en la búsqueda de conocimiento especializado (domain-specific knowledge), mientras que Claude Opus 4.1 fue el mejor evaluado en estética, como el formato de documentos y el diseño de diapositivas. Esto sugiere que las diferentes herramientas de IA podrían crear nichos complementarios de valor.

OpenAI enfatiza que el propósito de GDPval no es afirmar que la IA reemplazará de manera generalizada a los humanos. La compañía reconoce que, aunque los modelos sobresalgan en el tiempo de inferencia y la generación de contenido (lo que se traduciría en ahorro de costos de API), el uso real en un entorno de trabajo requiere supervisión humana, iteración e integración con procesos más amplios. Pero es claro que el hecho de que los modelos de IA ya han alcanzado el umbral de capacidad para realizar tareas específicas de manera experta, lo que abre la puerta a un mundo en el que la colaboración entre humanos e IA es la norma, elevando la productividad a niveles sin precedentes.