Automatizando la creatividad
Ahora hay evidencias sólidas de que la IA puede ayudarnos a ser más innovadores
ETHAN MOLLICK
13 AGO. 2023
La ironía central de las IA generativas es que se suponía que las IA serían pura lógica y sin imaginación. En cambio, obtenemos IA que inventan información, participan en discusiones (aparentemente) emocionales y que son intensamente creativas. Y ese último hecho es algo que hace que muchas personas se sientan profundamente incómodas.
Para ser claros, no hay una única definición de creatividad, pero los investigadores han desarrollado una serie de pruebas defectuosas que se utilizan ampliamente para medir la capacidad de los humanos para generar ideas diversas y significativas. El hecho de que estas pruebas fueran defectuosas no fue un gran problema hasta que, de repente, las IA pudieron superar todas ellas. Pero ahora, GPT-4 supera al 91% de los humanos en una variación de la Prueba de Usos Alternativos para la creatividad y supera al 99% de las personas en las Pruebas de Torrance de Pensamiento Creativo. Nos estamos quedando sin pruebas de creatividad que las IA no puedan superar.
Aunque estas pruebas psicológicas son interesantes, aplicar pruebas humanas a la IA puede ser un desafío. Siempre existe la posibilidad de que la IA haya estado previamente expuesta a los resultados de pruebas similares y simplemente esté repitiendo respuestas (aunque los investigadores en estos estudios han tomado medidas para minimizar ese riesgo). Y, por supuesto, las pruebas psicológicas no son necesariamente una prueba de que la IA pueda realmente generar ideas útiles en el mundo real.
Sin embargo, en las últimas semanas, hemos aprendido de tres nuevos trabajos experimentales que la IA realmente puede ser creativa en escenarios con implicancias en el mundo real. Quiero discutir brevemente estos trabajos y luego dar algunos consejos prácticos sobre cómo utilizar la IA para la generación de ideas basándome en sus resultados.
La IA es creativa en la práctica
Cada uno de los tres trabajos compara directamente la creatividad impulsada por la IA y el esfuerzo creativo humano en experimentos controlados. El primer trabajo importante proviene de mis colegas en Wharton. Organizaron un concurso de generación de ideas: enfrentando a ChatGPT-4 contra los estudiantes en una popular clase de innovación que históricamente ha llevado a muchas startups. Los investigadores — Karan Girotra, Lennart Meincke, Christian Terwiesch y Karl Ulrich — utilizaron jueces humanos para evaluar la calidad de las ideas, y encontraron que ChatGPT-4 generó ideas más numerosas, económicas y mejores que los estudiantes. Aún más impresionante, desde una perspectiva empresarial, fue que la intención de compra de los jueces externos también fue mayor para las ideas generadas por la IA. De las 40 mejores ideas calificadas por los jueces, 35 provenían de ChatGPT.
Un segundo trabajo llevó a cabo un concurso de crowdsourcing de amplio alcance, pidiendo a la gente que propusiera ideas de negocios basadas en reutilizar, reciclar o compartir productos como parte de la economía circular. Los investigadores (Léonard Boussioux, Jacqueline N. Lane, Miaomiao Zhang, Vladimir Jacimovic y Karim R. Lakhani) luego hicieron que los jueces calificaran esas ideas y las compararon con las generadas por GPT-4. El nivel de calidad general de las ideas generadas por la IA y los humanos fue similar, pero la IA fue juzgada como mejor en factibilidad e impacto, mientras que los humanos generaron ideas más novedosas.
El último trabajo hizo algo un poco diferente, enfocándose en ideas para escritura creativa, en lugar de ideas de negocios. El estudio de Anil R. Doshi y Oliver P. Hauser comparó a humanos trabajando solos para escribir cuentos cortos con humanos que utilizaron la IA para sugerir 3-5 temas posibles. Nuevamente, la IA resultó útil: los humanos con ayuda de la IA crearon historias que fueron juzgadas como significativamente más novedosas e interesantes que las escritas solo por humanos. Sin embargo, hubo dos advertencias interesantes. Primero, las personas más creativas fueron las menos ayudadas por la IA, y las ideas de la IA fueron generalmente juzgadas como más similares entre sí que las ideas generadas por las personas. Aunque nuevamente, esto fue utilizando la IA puramente para generar un pequeño conjunto de ideas, no para tareas de escritura.
Entonces, ¿Qué significa esto? Leyendo estos estudios, parece que hay algunas conclusiones claras:
La IA puede generar ideas creativas en situaciones prácticas y reales. También puede ayudar a las personas a generar ideas mejores.
Las ideas que genera la IA son mejores que las que la mayoría de las personas pueden concebir, pero las personas muy creativas superarán a la IA (al menos por ahora) y pueden beneficiarse menos al usar la IA para generar ideas.
Hay más similitud subyacente en las ideas que produce la actual generación de IA que entre las ideas generadas por un gran número de humanos.
Todo esto sugiere que los humanos aún tienen un gran papel que desempeñar en la innovación... pero sería una tontería no incluir la IA en ese proceso, especialmente si no se consideran altamente creativos. Entonces, ¿cómo deberíamos usar la IA para ayudar a generar ideas? Afortunadamente, los trabajos y otras investigaciones sobre innovación tienen algunas buenas sugerencias.
Solicitando Ideas
La gente se preocupa mucho por la idea de que hay que ser muy bueno formulando preguntas específicas a las IA para lograr que hagan algo. Pero esto simplemente no parece ser el caso en la generación de ideas. En el trabajo que compara la IA con el crowdsourcing, los autores probaron tres tipos de preguntas: unas básicas que planteaban el problema, otras más avanzadas que daban a la IA una personalidad para parecerse más a un solucionador humano ("Eres un Profesional Técnico y Creativo, ubicado en Europa."), y una muy avanzada que pedía a la IA que adoptara la perspectiva de expertos famosos en particular. Aunque hubo algunas diferencias entre estos grupos, ningún enfoque dominó claramente. Así que no me preocuparía demasiado por la redacción exacta de la pregunta, puedes experimentar para ver qué podría funcionar mejor.
Sinceramente, las preguntas simples parecían funcionar bien. El trabajo sobre concursos de innovación, por ejemplo, proporcionó una pregunta simple como contexto: Eres un emprendedor creativo que busca generar nuevas ideas de productos. El producto estará dirigido a estudiantes universitarios en Estados Unidos. Debe ser un bien físico, no un servicio o software. Me gustaría un producto que se pudiera vender a un precio minorista de menos de unos 50 dólares. Las ideas son solo ideas. El producto no necesita existir aún, ni necesariamente ser claramente factible. Numera todas las ideas y dale un nombre. El nombre y la idea están separados por dos puntos. Y también proporcionó una segunda pregunta: Por favor, genera diez ideas en diez párrafos separados. La idea debe expresarse en un párrafo de 40-80 palabras. Repitieron este proceso varias veces, porque generar muchas ideas es útil.
También compararon el valor de esta pregunta con GPT-4 con una utilizando el aprendizaje con pocos ejemplos (few-shot learning). El aprendizaje con pocos ejemplos es fácil de hacer: simplemente proporcionas a la IA ejemplos del tipo de resultados que te gustaría ver (los "pocos ejemplos" en lugar del aprendizaje "sin ejemplos" o "zero shot", donde no proporcionas ejemplos) antes de pedirle que genere ideas. Aunque la IA generó más y mejores ideas con los enfoques de pocos ejemplos, la diferencia no fue estadísticamente significativa. Al mismo tiempo, generalmente sugeriría usar técnicas de pocos ejemplos porque parecen ayudar subjetivamente, otras investigaciones las han encontrado valiosas y son fáciles de implementar.
Como ejemplo de la diferencia, le pedí a Claude 2 que generara 15 ideas originales de startups que serían adecuadas para Y Combinator (el famoso acelerador). Este fue un enfoque sin ejemplos. Luego probé un método con pocos ejemplos donde le di a la IA una lista de 400 startups recientes de Y Combinator, con descripciones de una frase de cada una, y le dije: Aquí tienes 400 de las últimas ideas de startups de Y Combinator. Identifica tendencias y luego genera 15 ideas originales combinando estos conceptos. Puedes ver la diferencia y por qué preferí el enfoque con pocos ejemplos.
Además de estas sugerencias, tengo un par de las mías propias. Primero, no solo pidas a la IA que genere ideas, utiliza también restricciones. En general, y contrario a lo que la mayoría de la gente espera, la IA funciona mejor para generar ideas cuando está más restringida (¡al igual que los humanos!). Oblígala a darte respuestas menos probables, y encontrarás combinaciones más originales, lo cual puede resolver el problema de la originalidad. Podrías querer preguntar: Eres un experto en resolución de problemas y generación de ideas. Cuando te piden resolver un problema, propones ideas novedosas y creativas. Aquí tienes tu primera tarea: "dime 10 formas detalladas en que una IA (o un superhéroe, o un astronauta, o cualquier otra profesión inusual) podría hacer _____. Describe los detalles de cada forma."
También puedes utilizar otras técnicas que aprovechen las formas en que la IA puede alucinar material plausible pero interesante, y usar eso como semilla de creatividad. Considera pedirle transcripciones de entrevistas falsas: Crea una transcripción de una entrevista entre un diseñador de productos y un dentista sobre los problemas que tiene el dentista, por ejemplo. O pídele que describa productos inexistentes: guíame a través de la interfaz de una nueva bomba de agua ficticia que tenga características emocionantes. Hay un arte en esto que puedes aprender experimentando, y debes sentirte libre de compartir otras técnicas de preguntas que funcionen en los comentarios.
La IA como motor creativo
Todavía no sabemos cuán originales pueden ser realmente las IA, y a menudo veo a la gente argumentar que los LLM (Modelos de Lenguaje a Gran Escala) no pueden generar ideas nuevas. Para mí, cada vez está más claro que esto no es cierto, al menos en un sentido práctico, en lugar de filosófico. En el mundo real, la mayoría de las ideas nuevas no vienen de la nada; se basan en combinaciones de conceptos existentes, razón por la cual los estudiosos de la innovación han señalado durante mucho tiempo la importancia de la recombinación en la generación de ideas. Y los LLM son muy buenos en esto, actuando como máquinas de conexión entre conceptos inesperados. Están entrenados para generar relaciones entre tokens que pueden parecer no relacionados para los humanos pero representan conexiones más profundas. Añade la aleatoriedad que viene con la salida de la IA, y el resultado es, efectivamente, una poderosa capacidad creativa.
En el sentido más práctico, ahora estamos mucho menos limitados por las ideas que nunca antes. Incluso las personas que no se consideran creativas ahora tienen acceso a una máquina que generará conceptos innovadores que superan a los de la mayoría de los humanos (aunque no a los más creativos). Donde antes solo había unas pocas personas con la capacidad de idear buenas ideas, ahora hay muchas. Este es un cambio asombroso en el panorama de la creatividad humana, y uno que probablemente hace que la ejecución, no la creatividad en bruto, sea un factor más distintivo para las futuras innovaciones.