Un sistema de IA que aprende un idioma de forma autónoma desarrolla un lenguaje estructurado de la misma manera que el humano. Y, al igual que los humanos aprendemos de generaciones anteriores, los modelos de IA mejoran cuando aprovechan el conocimiento de sus parientes más antiguos. Así lo demuestra un estudio de la Chalmers University of Technology y la University of Gothenburg (Suecia), que explora los mecanismos del lenguaje humano y proporciona conocimientos importantes para el desarrollo de la IA del futuro.
Los modelos de lenguaje basados en IA, como ChatGPT, imitan cada vez mejor el lenguaje humano y se utilizan cada vez más como herramienta para la producción de texto. Pero estos mismos tipos de modelos también pueden enseñarnos a comprender mejor cómo han evolucionado los idiomas humanos.
En el estudio, los investigadores exploraron un sistema de IA para la evolución de idiomas mediante dos métodos diferentes en una combinación no probada previamente. Por un lado, se utilizó el aprendizaje por refuerzo (donde las acciones correctas se recompensan y, por lo tanto, se refuerzan) y, por otro, se permitió que los modelos de IA aprendieran unos de otros a lo largo de generaciones.
Descubrimos que los modelos de IA alcanzaron una estructura similar a la del lenguaje humano, y que el aprendizaje de idiomas funcionaba de forma similar. Por lo tanto, el estudio proporciona información importante sobre el funcionamiento de los modelos de IA, así como una mayor comprensión de cómo evolucionan los idiomas humanos, afirma Emil Carlsson, quien en el momento del estudio era estudiante de doctorado en Chalmers y la Universidad de Gotemburgo.
Todos los idiomas buscan la eficiencia
Según una influyente teoría de la ciencia cognitiva, todo lenguaje humano se define por la necesidad de comunicarse eficazmente. Al mismo tiempo, se necesita un equilibrio: como herramienta, el lenguaje debe ser informativo, pero también lo suficientemente sencillo como para que podamos aprenderlo. Cuanta más información se deba comunicar, más matizado debe ser el lenguaje. Un ejemplo clásico es que los idiomas en climas más fríos suelen tener más palabras para la nieve y el hielo que los idiomas en climas más cálidos.
Para probar la teoría e investigar cómo el lenguaje se vuelve eficiente, los investigadores crearon agentes de IA (diferentes modelos de IA) que participaron en un juego de comunicación entre sí. A los agentes de IA se les mostró un color y una lista de símbolos que inicialmente no tenían significado. A medida que los agentes interactuaban, estos símbolos se asociaban con ciertos colores y se utilizaban para comunicar el color al otro agente.
«La razón por la que usamos colores es la gran cantidad de datos sobre cómo se nombra el espectro de colores en diferentes idiomas, incluyendo datos de idiomas aislados que nunca han estado expuestos a otros. La categorización de los colores varía entre idiomas, tanto en términos del número de palabras como de la parte del espectro que describen«, afirma Emil Carlsson.
Las recompensas y el intercambio generacional arrojaron resultados para el desarrollo del lenguaje
Los experimentos consistieron en que un agente de IA comunicaba un color mediante uno de los símbolos de la lista, y el agente receptor adivinaba a qué color correspondía. Ambos agentes recibían una recompensa común al progresar en su comunicación. Cuanto más se acercaban a una designación común del tono de color exacto que el agente receptor había obtenido, más puntos obtenían.
En el siguiente paso, se crearon nuevas «generaciones» de agentes de IA, mientras que los antiguos agentes de IA se fueron eliminando gradualmente. Los nuevos agentes de IA pudieron observar el diálogo y el lenguaje que la generación anterior había desarrollado. Posteriormente, pudieron interactuar entre ellos.
«La idea era que los agentes de IA aprendieran primero un lenguaje de generaciones anteriores y luego lo desarrollaran comunicándose entre sí. Como dos niños pequeños que aprenden escuchando a sus padres y luego continúan ampliando y desarrollando sus propios idiomas«, afirma Emil Carlsson.
Aporta conocimiento sobre el desarrollo del lenguaje
El resultado fue un sistema para nombrar colores similar a los lenguajes de colores humanos, a pesar de que los agentes de IA nunca habían tenido contacto con ellos.
Lo interesante fue que fue precisamente la combinación de la resolución de problemas en el juego, junto con el hecho de que los agentes de IA aprendieron de generaciones anteriores, lo que dio lugar a un lenguaje efectivo que se asemeja al lenguaje humano. Cuando los agentes de IA solo se comunicaban entre sí para resolver el juego, los lenguajes se volvieron demasiado complejos. También intentamos que los agentes de IA aprendieran solo de generaciones anteriores, sin tener que lidiar con el aspecto de la resolución de problemas del juego, y entonces los lenguajes se volvieron demasiado simples, afirma.
Según Emil Carlsson, los resultados indican que nuestra capacidad para comunicarnos y aprender unos de otros es crucial para el desarrollo de los idiomas a lo largo del tiempo.
«Cuando solo aprendemos algo de otra persona, sin comprender quizá sus beneficios, nuestra tendencia a desarrollar el conocimiento disminuye. Pero cuando realmente tenemos que usar lo aprendido para resolver problemas y avanzar, es cuando se pueden crear lenguajes estructurados y eficaces«, afirma.
Espera que los resultados contribuyan a nuevas perspectivas e ideas en la investigación lingüística, así como en la investigación en IA y ciencias de la computación.
«Este conocimiento puede ayudarnos a comprender mejor los mecanismos que subyacen a los lenguajes humanos, así como a comprender cómo funcionan los grandes modelos lingüísticos basados en IA. Esto puede allanar el camino para orientar el desarrollo de la IA en direcciones fructíferas«, afirma Emil Carlsson.