La IA ya parece más humana que las propias personas

La IA ya parece más humana que las propias personas

Las respuestas de GPT-4.5, una de las versiones de ChatGPT, pueden resultar más humanas que las de una persona real. (Reuters)

 

La inteligencia artificial generativa cada vez se parece más a las personas. Incluso puede llegar a mostrarse más humana en algunas circunstancias. Un reciente estudio, elaborado por investigadores de la Universidad de California (EE.UU.) y publicado en la revista ‘PNAS’, ha demostrado que los sistemas de inteligencia artificial actuales ya son capaces de superar el test de Turing, elaborado en 1950 por el matemático británico del mismo nombre para evaluar si una máquina puede comportarse y comunicarse como alguien de carne y hueso.

Por abc.es





«Descubrimos que si se los modelos reciben las indicaciones adecuadas, pueden emplear el mismo tono, franqueza, humor y falibilidad que los humanos», afirmó Cameron Jones, doctor en Ciencias Cognitivas y autor principal del estudio. El investigador explica que ya se sabía que »los sistemas de inteligencia artificial pueden generar conocimiento fácilmente sobre casi cualquier tema«, pero ahora, con su trabajo, se demuestra que »pueden mostrar de manera convincente rasgos de comportamiento social, lo cual tiene importantes implicaciones para nuestra concepción de la IA».

Para realizar el estudio, los investigadores utilizaron cuatro modelos diferentes. Por un lado, dos de los sistemas más avanzados de la actualidad -GPT-4.5, de OpenAI, y LLaMa-3.1-405B, de Meta- y, por otro, dos modelos más antiguos: GPT-4o y ELIZA, considerado el primer chatbot de la historia y desarrollado en los años sesenta.

El experimento consistió en enfrentar a cada uno de los cerca de 300 participantes humanos reclutados a dos interlocutores simultáneos: otra persona real y un sistema de inteligencia artificial. Sin saber quién era quién, debían conversar con ambos y, al finalizar, decidir cuál de los dos creían que era realmente humano. Los temas de conversación solían girar en torno a cuestiones cotidianas y personales: desde qué habían hecho durante el día hasta sus gustos musicales, emociones, estudios, películas favoritas o experiencias vitales.

De acuerdo con los resultados del estudio, los participantes tuvieron serios problemas para diferenciar a las máquinas de las personas. La que más fallos provocó fue GPT-4.5, que fue considerada como el interlocutor de carne y hueso en el 73% de las ocasiones, lo que implica que en muchos casos sus respuestas parecían más humanas, incluso, que las de alguien real. El porcentaje en el caso de Llama bajó al 56%, que sigue siendo un resultado nada desdeñable. Mientras tanto, los modelos más antiguos, GPT-4o y ELIZA, se quedaron bastante lejos, con un 23% y un 21% respectivamente.

Para conseguir estos resultados, los modelos fueron previamente instruidos por los investigadores, que les pidieron adoptar una personalidad concreta. En el caso de los sistemas más exitosos, los investigadores les ordenaron comportarse como jóvenes familiarizados con internet y acostumbrados a expresarse de forma coloquial.

Cuando las herramientas no recibían ninguna preparación, sus resultados se resentían mucho. La herramienta que sacó mejores resultados fue Llama, que logró engañar a los participantes en el 38% de los casos. En opinión de Ben Bergen, profesor de Ciencias Cognitivas en la Universidad de San Diego y coautor del estudio, esto demuestra que las máquinas «tienen la capacidad de parecer humanos, pero tal vez no tanta la capacidad de averiguar qué se necesita para parecer humanos» si no se las guía antes un poco.

Sea como sea, los investigadores alertan del potencial peligro de que grupos con fines maliciosos se aprovechen de la capacidad de las máquinas para hacerse pasar por humanos engañando a los usuarios. «Hay mucha gente a la que le gustaría usar bots para persuadir a otros de que compartan sus números de la seguridad social, voten por su partido o compren sus productos», dice el autor principal del estudio.