OpenAI ha iniciado una nueva iniciativa que busca avanzar en el desarrollo de inteligencia artificial (IA) más efectiva. La empresa está solicitando a contratistas externos que compartan ejemplos de tareas reales realizadas en sus trabajos. Este esfuerzo forma parte de un proyecto más amplio destinado a establecer un punto de referencia humano para medir el rendimiento de sus modelos de IA en comparación con profesionales humanos. La recopilación de datos se basa en la premisa de que la IA debe ser evaluada no solo por su capacidad técnica, sino también por su desempeño en contextos laborales reales.
La información se ha obtenido a través de documentos de OpenAI y Handshake AI, que colaboran en esta recopilación. Según los informes, el proceso de evaluación comenzó en septiembre y está diseñado para medir cómo los modelos de IA se desempeñan en diversas industrias. El objetivo final es alcanzar un nivel de inteligencia general artificial (AGI), donde la IA supere a los humanos en la realización de tareas que generan valor económico.
La recopilación de tareas laborales
En un documento confidencial, OpenAI explica que ha contratado a individuos de diferentes sectores para que contribuyan con ejemplos de trabajos realizados. Se les pide que tomen proyectos de larga duración o complejos y los transformen en tareas concretas. Esto permite a la empresa evaluar con mayor precisión cómo sus modelos de IA se desempeñan en situaciones laborales reales.
Ejemplos específicos de tareas
Un ejemplo presentado en la presentación de OpenAI describe una tarea de un Gerente de Estilo de Vida Senior en una empresa de conserjería de lujo. La tarea consiste en preparar un documento PDF de dos páginas que detalle un itinerario de una semana en yate a las Bahamas para una familia que viaja por primera vez. Este documento no solo menciona el destino, sino que también incluye detalles sobre los intereses de la familia, lo que añade una capa de complejidad a la tarea.
El entregable esperado es un itinerario real que el contratista habría creado para un cliente, lo cual demuestra la importancia de utilizar ejemplos reales en el proceso de evaluación. OpenAI enfatiza que los contratistas deben compartir ejemplos que reflejen su trabajo real y no meras descripciones o resúmenes.
Consideraciones éticas y de confidencialidad
A medida que OpenAI avanza en este proyecto, surgen preocupaciones sobre la confidencialidad y la propiedad intelectual. Los contratistas deben asegurarse de eliminar cualquier información confidencial de las tareas que suban para evitar violaciones a acuerdos de no divulgación. Un documento revisado por WIRED menciona una herramienta llamada «Superstar Scrubbing», que ayuda a los usuarios a eliminar datos sensibles.
Riesgos legales para los contratistas
Evan Brown, abogado especializado en propiedad intelectual, advierte sobre el riesgo que enfrentan los contratistas al proporcionar documentos de trabajos anteriores, incluso después de ser depurados. Si algo se filtra que no debería, podría resultar en reclamaciones relacionadas con la apropiación indebida de secretos comerciales. Esto coloca a contratistas y a OpenAI en una posición delicada en términos de responsabilidad legal.
La confianza que OpenAI deposita en sus contratistas para determinar qué información es confidencial puede resultar en complicaciones legales si no se maneja correctamente. Es crucial que la empresa implemente medidas para evaluar y eliminar adecuadamente información que podría considerarse un secreto comercial.
Nueva era en la IA
La iniciativa de OpenAI de utilizar ejemplos del mundo real para evaluar su inteligencia artificial representa un avance significativo en la búsqueda de un AGI efectivo. Sin embargo, esta estrategia también plantea desafíos en términos de ética y legalidad. Mantener un equilibrio entre la innovación y la protección de datos sensibles será fundamental a medida que la empresa continúe su desarrollo.


