⏰🚀 Adelantando el reloj: la IA supera predicciones.

¿Dónde está el límite ahora?

Esta semana

🧠 Una idea descifr[ada]: ¿Dónde está el límite ahora?

🧰 Dos herramientas de IA que pueden mejorar tu productividad: una herramienta de texto completísima y el futuro de las encuestas.

📰 Tres noticias relevantes de IA de la semana pasada: nueva herramienta texto-a-video, muere Twitter y modelos virtuales.

🖼️ Cuatro fotos generadas con IA: diseños de cocinas inspirados en personajes famosos.

🧠 Una idea descifr[ada]: ¿Dónde está el límite ahora?

En enero de 2021, Michael Wooldrige, PhD en inteligencia artificial y profesor de computación de la universidad de Oxford, publicó este libro:

En la página 10 uno puede encontrar una lista de las tareas que la IA ha resuelto, acompañado por el año aproximado donde los investigadores lograron que la IA hiciera esa tarea.

Las tareas van desde lo fácil, como por ejemplo la aritmética básica, que fue resuelta en 1945, pasando por tareas un poco más complejas, como jugar ajedrez o GO, hasta las tareas que están casi siendo resueltas hoy, como los autos autónomos.

Si te fijas bien, al final de la lista el investigador enumera una serie de tareas que “no están ni cerca de ser resueltas”. Y más abajo, en el pie de página, dice que en el presente “no tenemos idea como hacer que los computadores hagan las tareas del fondo de la lista”.

Estas tareas son:

  • Entender una historia y responder preguntas sobre ella

  • Traducciones automatizadas a nivel humano

  • Interpretar lo que está pasando en una foto

  • Escribir historias interesantes

  • Interpretar una obra de arte

  • Inteligencia general a nivel humano

Uno de los investigadores más importantes en IA, hace 2 años, dijo eso.

Hoy, la IA puede resolver todos menos uno.

Vamos por punto.

Entender una historia

Ya sabemos que ChatGPT es muy bueno entendiendo y escribiendo texto.

Pero traigo dos ejemplos que son menos comunes y que ilustran el poder de los LLMs (Grandes Modelos de Lenguaje) como ChatGPT.

Primero, tomé el último modelo del chatbot Claude. Esta es una IA menos conocida, comparado con ChatGPT o Bing Chat, pero tiene una particularidad interesante. A diferencia de ChatGPT, en el que puedes escribir hasta un máximo de 3.000 palabras en la cajita del chat, en Claude puedes escribir hasta 75.000 palabras.

Puedes probar este chatbot con un máximo de 3 mensajes aquí.

Aprovechándome de esa característica, le copié y pegué el libro completo del principito, y le pregunté por la historia.

En menos de 15 segundos me respondió esto:

Mientras hacía este experimento me surgió la duda de si Claude generaba la respuesta porque estaba leyendo el libro que le escribí o porque ya tenía conocimientos previos sobre este libro en su “memoria”. Con “memoria” me refiero a los miles de libros y texto en los que son entrenados estos modelos.

Por lo que llevé el experimento un paso más allá. En la mitad del libro, entre las 13.000 palabras de la historia, agregué un capítulo nuevo:

Y le pedí que me describiera a todos los personajes con los que se encontraba el principito en la historia:

Por lo tanto, la IA lee palabra por palabra la historia y la entiende a la perfección.

Traducciones

Hace mucho tiempo que los computadores pueden traducir frases simples.

Desde su debut en 2006 hasta 2016, el sistema ocupaba un enfoque estadístico simple. Buscaba la frase a traducir en su extensa biblioteca de referencia y hacía la traducción palabra por palabra o frase por frase.

Como podrás adivinar, sus traducciones no eran muy buenas.

A partir del 2017 comenzaron a ocupar redes neuronales más complejas, similares a las que ocupa ChatGPT hoy, y su calidad mejoró sustancialmente.

PBMT era el método estadístico simple. Su evolución, GNMT, es el sistema de redes neuronales que Google Traductor ocupa hoy.

Pero como cualquier estudiante que ha intentado traducir un ensayo completo en Google Traductor sabe, la herramienta todavía no es perfecta.

La traducción se siente robótica y le falta fluidez. Por lo mismo, el autor del principio puso a la traducción “a nivel humano” en las cosas que todavía “no estamos ni cerca de resolver”.

Pero hoy los LLMs detrás de ChatGPT o Bard (de Google) son mejores que Google Traductor para esa misma tarea.

En el caso de Bard, el modelo que está por detrás se llama PaLM2, y en varias pruebas le va mejor que Google Traductor.

Filas: se compara PaLM (el modelo antiguo de Google), Google Traductor y PaLM 2 (el nuevo). Columnas: se evalúa la traducción de Chino a Inglés, e Inglés a Alemán en dos pruebas: BLEURT (más es mejor) y MQM (menos es mejor).

Los que han ocupado ChatGPT o Bard lo suficiente para traducir cosas, saben que estamos al nivel de una traducción humana.

Un poema traducido al inglés, coreano y farsi.

Otro punto para la IA.

Interpretar una foto

Hace poco publiqué esto en LinkedIn:

¿Tú también viste un huevo o no?

Esa foto se la pasé a Bing Chat, el chatbot gratuito de Microsoft que viene en el navegador Edge que está en todos los computadores Windows.

Es impresionante el nivel de precisión del sistema de visión.

Y es que, a lo largo de los años, los sistemas de reconocimiento de imágenes han ido mejorando hasta alcanzar un 91,1% de precisión. Mucho mejor que varios humanos que conozco (🙋‍♂️🤓).

Evolución de los modelos de visión en su precisión. Fuente.

Creo que podemos decir:

Historias

Esta es la especialidad de los LLMs.

Y es que dentro los datos que se ocuparon para entrenarlos, una buena porción son libros.

Datos que se ocuparon para entrenar a GPT-3. No hay datos públicos sobre el set de entrenamiento de GPT-3.5 (ChatGPT gratis) ni de GPT-4 (ChatGPT plus), pero podemos asumir una proporción similar y una (mucho) mayor cantidad de tokens. Fuente.

67 billones de tokens (12 + 55) equivalen aproximadamente un millón de libros. Y eso es en el caso de GPT-3 que ya ni siquiera se usa. Para ChatGPT probablemente sea 2x o 3x esa cantidad.

En fin, muchos libros. Muchas historias.

¿Te imaginas la calidad de historia que podría contar una persona si se lee un millón de ellas?

Exacto.

Y ChatGPT (y sus primos Bard, Claude y Bing Chat) son muy buenos escribiendo historias.

Así lo descubrió una persona en internet que ocupó ChatGPT para escribir un libro completo.

Si se fijan, el autor es “GPT-4”. La foto fue creada usando otra herramienta de IA: Midjourney.

Puedes leer el libro completo en inglés gratis, y además puedes ver el proceso de la “meta-autora” para hacer que ChatGPT hiciera el libro completo.

El libro no se va a ganar ningún premio, pero es suficientemente interesante.

Interpretar arte

Esta es la tarea que suena más compleja.

Y, además, por su nivel de subjetividad, es la más difícil de medir.

¿Cómo podemos saber si una interpretación artística es “buena” o “mala”?

Por naturaleza, una interpretación es subjetiva. Lo que una obra de arte me transmite a mí puede ser diferente a lo que te transmite a ti. Ninguna de las dos percepciones es "errónea".

Pero vamos a dejar que cada uno juzgue por sí mismo. Aquí un ejemplo:

Otro ejemplo:

Bing Chat: “Una posible interpretación es que representa la pérdida de la identidad individual en una sociedad que impone roles y expectativas sobre las personas. Los dos personajes tienen sus cabezas cubiertas con un paño blanco, lo que sugiere que no pueden expresar su verdadero yo. El contraste entre el vestido rojo y el traje negro indica que hay una diferencia de género y de clase entre ellos, pero que ambos están sometidos a las normas sociales.”

Última 🙂:

Bing Chat: “Una forma de verla es como una crítica a la sociedad moderna y sus contradicciones. Los colores brillantes y las formas geométricas pueden sugerir una apariencia de orden y armonía, pero también pueden ocultar una realidad más caótica y conflictiva. Los rostros y las figuras pueden representar a las personas que viven en un mundo fragmentado y alienado, donde se pierde el sentido de la unidad y la comunicación.”

No soy crítico de arte, pero a mi juicio:

Lo que nos lleva al último punto.

Inteligencia General Humana

Hay IAs que son mejores que los humanos para algunas cosas: jugar ajedrez, reconocer imágenes, comprar acciones, etc.

A estas IAs que pueden hacer muy bien una cosa se les llama Inteligencia Artificial Limitada, o ANI por sus siglas en inglés.

Cuando hablamos de Inteligencia Artificial General (o AGI por sus siglas en inglés) nos referimos a un sistema que puede hacer todo igual o mejor que un humano.

Todavía no estamos ahí, pero estamos cerca.

Metaculus, una página de internet que monitorea las predicciones de cientos de personas, nos muestra que la fecha estimada en donde tendremos una AGI se ha ido acercando.

A principio de 2020 las estimaciones estaban en 2053, hoy la fecha estimada es que tendremos AGI el 2026.

Predicción de fecha en donde tendremos AGI (eje Y) a lo largo del tiempo (eje X).

Por lo que nos queda solo uno de la lista por tachar.

Pero estamos cerca.

🧰 Dos herramientas de IA que pueden mejorar tu productividad

  1. Ocupo LanguageTool hace 3 años. Es como Grammarly pero en español. Me ayuda a corregir faltas de ortografía, gramática, puntuación y a encontrar sinónimos. Y hace poco, como todo el mundo, sacaron funcionalidades que ocupan IA para mejorar la escritura o reescribir párrafos completos. Muy útil.

  2. ¿Cómo se ve el futuro de las encuestas y los formularios en un mundo con IA? Esa pregunta se hizo el equipo de Typeform, la herramienta que ocupo hace años para hacer formularios simples y elegantes. Su respuesta: Formless. Todavía no está abierto al público, pero vale la pena probarlo. A través de una conversación no-estructurada son capaces de recolectar datos estructurados. Es una encuesta que se siente como una conversación.

📰 Las tres noticias más importantes sobre IA de la semana pasada

  1. Runway, el unicornio fundado por chilenos que te permite generar video a partir de texto, acaba de lanzar su nueva versión al público. La Gen-2 de su software genera videos mucho más reales. Estamos acercándonos de al punto en que cualquiera va a poder generar películas del nivel de hollywood.

  2. Elon Musk oficialmente mató Twitter. En su lugar dejó la marca X.ai. La nueva CEO de Twitter X dice que busca transformarse en una app “para todo”, como lo es WeChat en China: mensajería, pagos, audio, video, compras, etc.

  3. Esta noticia me llamó mucho la atención: existen “modelos virtuales” (generadas por IA) que tienen miles de seguidores. Como Milla Sofía, quien se describe en TikTok como un “robot de 19 años, hecho con IA”. Y tiene 100.000 seguidores 🤯.

🖼️ Cuatro fotos generadas con IA

Diseños de cocinas inspirados en personajes conocidos.

Mario Bros

Barbie

R2D2

Shrek

🦾 ¡Eso es todo por ahora!

Al suscribirte a este boletín, prometí ser tu fuente de información y ayudarte a entender el mundo de la IA. ¿Qué te pareció el newsletter de hoy? Responde este correo y dime qué te gustaría ver más.

Si crees que esta información podría serle útil a alguien conocido, reenvíale este correo.

Si eres alguien que recibió este correo porque alguien te lo reenvío, y te gustaría seguir recibiéndolo, deja tu correo aquí.

¡Gracias por leer!

Nos vemos la próxima semana