¿Qué pasaría si la IA pudiera aprender de sus errores?

La habilidad de reflexión en la IA: ¿cómo nos acerca a la forma en que los humanos pensamos?

En el mail de esta semana

🧠 Una idea descifr[ada]: ¿Qué pasaría si la IA pudiera aprender de sus errores?

🧰 Dos herramientas de IA que pueden mejorar tu productividad

📰 Tres noticias relevantes de IA de la semana pasada

🧠 Una idea descifr[ada]: ¿Qué pasaría si la IA pudiera aprender de sus errores?

Intenta resolver este problema

“Matías tenía el doble de edad que su hermana Florencia cuando él tenía seis años. Hoy, Matías tiene 30 años. ¿Cuántos años tiene Florencia?”

Algunos leyendo esto y reviviendo el estrés postraumático de las matemáticas del colegio.

Si respondiste 27, felicitaciones, estás en lo correcto.

Si te fuiste por otro lado. No te sientas solo/a. Esta misma pregunta se la hice a ChatGPT y la tuvo incorrecta:

Por lo menos no te fue tan mal como a ChatGPT. Seguro pensaste en 15.

Lo notable, y el tema de este post, es que ChatGPT es capaz de reflexionar sobre su respuesta y corregir su error.

No te preocupes ChatGPT, te perdono.

En un paper reciente, investigadores del MIT y de la universidad de Northestearn probaron esta habilidad de reflexión en dos conjuntos de tareas.

En el primer set de pruebas fue uno bien particular llamado AlfWorld. Ahí, la IA puede interactuar con un mundo simulado y realizar tareas cotidianas como encontrar objetos escondidos o mover objetos de un lado a otro.

Aquí la tarea de la IA es encontrar un florero y ponerlo en la caja fuerte

Probaron 134 de este tipo de tareas con una IA “normal” y con otra que podía reflexionar y aprender de sus errores. Les permitieron hacer varias veces cada escenario, lo que puso en ventaja a la IA que podía reflexionar sobre lo que no le había funcionado. Estos son los resultados:

Los colores importantes aquí son el azul (IA que reflexiona) y el rojo (IA sin reflexión).

En un primer intento ambas IAs completaron el 63% de las tareas correctamente, pero cuando se les dieron más oportunidades para completar el resto, la IA que reflexiona se dispara, llegando a completar correctamente un 97% de las tareas. En contraste, la IA sin poder de reflexión solo mejora “un poco” con respecto al 63% inicial, y luego se queda estancada.

El segundo conjunto de tareas es HumanEval, un conjunto de 164 problemas de programación que se utiliza bastante para probar la capacidad de los nuevos modelos de IA.

Hasta ahora, el modelo más eficiente para abordar esta serie de pruebas había sido GPT-4, capaz de resolver correctamente el 67% de los problemas. Pero si le entregas a GPT-4 la capacidad de reflexionar, entonces logra romper su propio récord.

El podio de los mejores modelos en programación. GPT-4 rompe su propio récord, mejorando en más de 30% su rendimiento cuando se le permite reflexionar.

¿Por qué todo esto es importante?

El hecho de que una IA pueda hacer metacognición, es decir, reflexionar sobre su propio pensamiento y aprendizaje para mejorar sus estrategias, la acerca cada vez más a la forma en que nosotros como humanos pensamos.

En palabras de los autores del paper: “La inteligencia humana es notable por su capacidad para aprender de los errores. A menudo no resolvemos problemas en el primer intento, pero cuando cometemos errores generamos nuevas ideas para perfeccionar nuestro enfoque a través de la auto-reflexión.”

Esta habilidad de reflexión emparejada con otros avances en IA que se lograron esta semana, como la posibilidad de tener memoria de largo plazo o de hacerse consultas a sí misma (lo que algunos denominan AutoGPT), nos deja más cerca de ese sueño (pesadilla?) de ciencia ficción en donde la IA se construye y mejora a sí misma de manera exponencial.

Algo así.

Hoy me siento entre el segundo y tercer cuadro de este comic de Wait But Why. La IA va a estar al mismo nivel de la humana solo por unos segundos, ya que después de eso, si sabe cómo mejorarse a sí misma, no hay nada que la detenga.

🧰 Dos herramientas de IA que pueden mejorar tu productividad

  1. Este número de WhatsApp funciona como ChatGPT con superpoderes. Puedes preguntarle cualquier cosa, pedirle que genere imágenes e incluso que transcriba esos podcasts audios de 10 minutos que algunos te mandan.

  2. Con Butternut puedes crear una página web en 20 segundos solo dándole el nombre de tu marca y algunas palabras clave. Los resultados no son perfectos, pero son una excelente base para seguir construyendo o para sacar ideas.

📰 Tres noticias relevantes de IA de la semana pasada

  1. Meta lanzó el sistema de reconocimiento de imágenes más avanzado hasta la fecha. Pude probarlo, subir una foto mía, y seleccionar cada objeto de la foto como si estuviera recortado.

  2. Anthropic, una “pequeña” startup de investigación de IA, acaba de levantar 5 billones de dólares con el fin de “ganarle a OpenAI” en la carrera por la mejor inteligencia artificial en los próximos 18 meses.

  3. Hay dos grandes jugadores del mundo tech que se han mantenido sospechosamente silenciosos en la carrera por la IA: Apple y Amazon. El segundo hace poco rompió el silencio en una carta a sus empleados donde les dice que tiene un “as bajo la manga”.