Explorando las colaboraciones de OpenAI para impulsar la comprensión profunda de la inteligencia artificial

Navegación del sitio

Enlaces rápidos de navegación

Navegación móvil

Navegación del sitio

Investigación

API

ChatGPT

Empresa

Enlaces rápidos

Asociaciones de datos de OpenAI

Trabajando juntos para crear conjuntos de datos de código

Enlaces rápidos

Autores

Estamos presentando las Asociaciones de Datos de OpenAI, donde trabajaremos en colaboración con organizaciones para producir conjuntos de datos públicos y privados para entrenar modelos de inteligencia artificial

La tecnología de IA moderna aprende habilidades y aspectos de nuestro mundo, como las personas, nuestras motivaciones, interacciones y la forma en que nos comunicamos, al comprender los datos en los que se entrena. Para lograr finalmente una AGI que sea segura y beneficiosa para toda la humanidad, nos gustaría que los modelos de IA comprendan profundamente todos los temas, industrias, culturas e idiomas, lo cual requiere un conjunto de datos de entrenamiento lo más amplio posible.

Incluir tu contenido puede hacer que los modelos de IA sean más útiles para ti al aumentar su comprensión de tu dominio. Ya estamos trabajando con muchos socios que están ansiosos por representar datos de su país o industria. Por ejemplo, recientemente nos asociamos con el Gobierno de Islandia y Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés mediante la integración de sus conjuntos de datos seleccionados. También nos asociamos con la organización sin fines de lucro Free Law Project, que tiene como objetivo democratizar el acceso a la comprensión legal al incluir su gran colección de documentos legales en el entrenamiento de IA. Sabemos que puede haber muchos más que también desean contribuir al futuro de la investigación en IA mientras descubren el potencial de sus datos únicos.

Las asociaciones de datos tienen como objetivo permitir que más organizaciones contribuyan a guiar el futuro de la inteligencia artificial y se beneficien de modelos que sean más útiles para ellos, al incluir contenido que les interese.

Estamos buscando tipos de datos específicos que reflejen la sociedad humana a gran escala y que actualmente no sean accesibles en línea para el público en general. Podemos trabajar con cualquier tipo de información, ya sea texto, imágenes, audio o video. Nos interesa especialmente obtener datos que expresen la intención humana, como escritos extensos o conversaciones completas en lugar de fragmentos desconectados, en cualquier idioma, tema o formato.

Podemos trabajar con datos en casi cualquier formato y utilizar nuestra tecnología de inteligencia artificial de última generación para ayudarte a digitalizar y estructurar tus datos. Por ejemplo, contamos con una tecnología de reconocimiento óptico de caracteres (OCR) de primer nivel para digitalizar archivos como PDF, y un reconocimiento automático de voz (ASR) para transcribir palabras habladas. Si los datos necesitan ser limpiados (por ejemplo, si tienen muchos artefactos generados automáticamente o errores de transcripción), podemos trabajar con tu equipo para procesarlos de la forma más útil. No estamos buscando conjuntos de datos con información sensible o personal, ni información que pertenezca a terceros; podemos trabajar contigo para eliminar esta información si necesitas ayuda.

Formas de asociarse con nosotros

Actualmente tenemos dos formas de asociarnos y es posible que se expandan en el futuro.

En resumen, estamos buscando colaboradores que quieran ayudarnos a enseñar a la inteligencia artificial a comprender nuestro mundo para que pueda ser de máxima utilidad para todos. Juntos, podemos avanzar hacia una IA general que beneficie a toda la humanidad.

Escritores

OpenAI

Investigación

API

ChatGPT

Compañía

Social

Leave a Reply

Your email address will not be published. Required fields are marked *