Ya se ha comprobado que existen artículos científicos escritos por IA, la pregunta es qué tan grave es esto. Para conocer el alcance de esta práctica, Un grupo de investigadores revisó millones de resúmenes de artículos. publicó en PubMed y encontró algo interesante: hay una palabra que le encanta a la IA, y la razón por la que le gusta tanto no está clara.
Sumérgete. Su traducción es “profundizar” y su uso se multiplicó entre 2022 y 2024, lo que coincidentemente coincide con el auge de ChatGPT y los modelos de lenguaje. Otras palabras como “guión bajo” o “presentación” también se citan con un aumento de frecuencia de x13,8 y x10,7 respectivamente. Ninguno de estos es un sustantivo o una palabra relacionada con el contenido, sino que tienen que ver con el estilo de escritura y son muy característicos del lenguaje florido que suelen utilizar los LLM.
lenguaje florido. ¿Eso significa que si vemos una de estas palabras en un artículo, fue escrita con IA? No necesariamente, pero la subida es brutal. Los investigadores han comparado el aumento de «profundizar» con otras palabras clave como «pandemia», que alcanzó un gran pico en 2020 y comenzó a disminuir en 2021. El aumento en la frecuencia de uso de «profundizar» es mucho más pronunciado que cualquier otro.
no es una coincidencia. Hay una fase en el proceso de creación de un chatbot como ChatGPT que requiere intervención humana para refinar las respuestas; Se trata del llamado Aprendizaje por Refuerzo a partir de la Retroalimentación Humana (por las siglas en inglés). RLHF). Resulta que la mayoría de los trabajadores dedicados a esta labor de refinación están radicados en países africanos como Nigeria. Adivina donde El uso de estas palabras en inglés formal está muy extendido.. Exacto, en Nigeria.
estilo africano. “Delve” es una palabra bastante común en inglés comercial en África, particularmente en Nigeria, y no es la única. También hay otras palabras como «apalancamiento», «explorar» o «tapiz» que son más comunes en el inglés africano. Respectivamente Instituto 311Aunque la retroalimentación humana es muy pequeña en comparación con las grandes cantidades de datos de entrenamiento, aún tiene un gran impacto ya que marca el tono del modelo a medida que nos responde.
Etiquetado de datos. Este es un paso importante para entrenar modelos de lenguaje grandes y requiere que la gente lo respalde. El problema es que la mayoría de trabajadores dedicados a este campo proceden de países pobres como Nigeria, Kenia o India. En caso de eso dias interminables Y los ridículos salarios no bastaban, los trabajadores tenían que revisar muchas veces imágenes violentas y muy explícitas, todo ello sin ningún apoyo psicológico.
En | Ser presentador porno no es nada divertido. Estuvo expuesto a “contenido extremo, violento, gráfico y sexualmente explícito”.
Imagen | Instituto Nacional de Alergias y Enfermedades Infecciosas En desempaquetar





