Inteligencia artificial y literatura: Un cuento de Juan Bosch en pixeles

Nos encontramos en una especie de “Nuevo Renacimiento”. Una creciente y latente fascinación por la Inteligencia Artificial (IA) ha hecho que en las últimas décadas encontremos un lugar para la IA en todos los escenarios imaginables.

Desde aplicaciones cotidianas (asistentes de voz y navegadores de mapa), hasta en ingeniería (evolución de la digitalización del sector eléctrico), medicina (análisis de imágenes en cardiología), música (personalización de listas de reproducción) y ahora, en el arte y la experiencia creativa.

Esta es la historia de como usé MidJourney, el programa de IA más discutido, fascinante y controvertido del 2023, para ilustrar uno de los cuentos más célebres e inmortales de la literatura dominicana: “La mujer” de Juan Bosch, maestro de este género literario, novelista, dirigente político, ensayista e ilustre hijo de la provincia que me vio crecer, La Vega.

Este proyecto nace con la intención de celebrar el 90 aniversario de la publicación de esta obra, en el contexto de la celebración del Dia Internacional de la Mujer 2023, y con el deseo de agregar un componente visual a esta historia que le permita llegar a nuevos ojos.

Con el soporte de la Fundación Juan Bosch, estaré presentando este trabajo en la XXV Feria Internacional del Libro de Santo Domingo 2023, que tendrá lugar del 24 de agosto al 3 de septiembre en la Plaza de la Cultura Juan Pablo Duarte, con el título: «Inteligencia artificial y literatura: cuentos de Juan Bosch en pixeles».

Ilustración 1 – Portada de la ilustración.Midjourney

Un poco de contexto: ¿Qué es MidJourney y dónde está la magia?

La premisa es básica para el que está familiarizado con el adagio: “una imagen vale más que mis palabras”.MidJourney es un programa de inteligencia artificial que genera imágenes a partir de indicaciones textuales. El software llegó en el verano del 2022 como un soplo de aire fresco, que pronto se convirtió en un huracán que ha puesto patas arriba a toda una industria, creando espacios completamente nuevos para la “imaginación amplificada”, y brindando una herramienta con superpoderes para que mentes creativas den vida sus sueños lúcidos.

Aunque muchos otros programas de IA funcionan bajo el mismo contexto (Dall-E, Imagen y StableDiffusion), Midjourney se lanzó en la plataforma de comunicación social Discord, lo que permitió a los usuarios no solo crear, pero también aprender de la experiencia de otros creadores, creando comunidades en nichos específicos y haciendo del proceso creativo una experiencia menos competitiva y más colaborativa.

Ilustración 2 – Logo de MidJourney

Si bien la tecnología detrás de cómo funcionan los algoritmos y cómo se utiliza la aplicación en discord es fascinante y absorbente, quedará fuera de esta historia. El lector interesado puede visitar la página oficial o (mejor) explorar “La guía no muy oficial de MidJourney” desarrollada por un creador ávido de la comunidad para obtener más información.

Trayendo a la vida “La Mujer”: Medio y contenido

“La Mujer” es uno de los cuentos más publicados de Bosch, una historia cargada de realidad y de un impacto emocional cuyo eco aún resuena en nuestras sociedades, la violencia de genero.

La trama de la historia es sencilla: Una mujer maltratada por su marido y echada de su casa con su pequeño hijo es socorrida por un extraño. El esposo y el extraño luchan entre sí, y la mujer mata al hombre que le había ayudado.

Para ilustrar la historia, decidí utilizar el formato de la novela gráfica, muy parecido al de la tira cómica. En esta, una serie de imágenes adyacentes, generalmente dispuestas horizontalmente, están diseñadas para leerse como una secuencia narrativa o cronológica.

Se pueden introducir palabras dentro o cerca de cada imagen, o se pueden prescindir de ellas por completo. Si las palabras dominan funcionalmente la imagen, entonces se convierte simplemente en una ilustración de un texto.

El relato puede dividirse en tres (3) grandes partes.

La primera parte (desde la página 1 a la página 6) la comprende la descripción del paisaje y la presentación de los personajes. Bosch utiliza un lenguaje lleno de imágenes poéticas, en particular las descripciones del paisaje donde se combinan varios métodos narrativos. La combinación de imágenes deslumbrantes de la naturaleza muerta y la técnica estilística transforman el escenario de un lugar geográfico en una situación vivencial.(De Olmos, 1980)

Ilustración3

La segunda parte (página 7 a página 9) es también descriptiva, tratándose de los antecedentes que crearon la situación desamparada de la mujer. El ritmo es más acelerado, hay dialogo entre los personajes y, en general, constituye una especie de “flashback” explicativo.(De Olmos, 1980).



Ilustración 4

La tercera y última parte ((página 10 a página 14) es la culminación o síntesis de la situación planteada en las primeras dos; la acción sigue acelerándose hasta el final donde se produce el clímax-desenlace para regresar en las últimas líneas al tiempo y espacio del comienzo. (De Olmos, 1980).

Ilustración 5

Trayendo a la vida “La Mujer”: El proceso creativo

Para poder describir el proceso creativo-iterativo necesario para alcanzar ideas concretas en MidJourney, contaré(muy) brevemente como fue el desafío de dar vida a: [1] Quico (uno de los personajes) y [2] al espacio y el tiempo en que se desarrolla la obra.

De la floreciente comunidad de MidJourney en Discord surgieron (a la velocidad de la luz) una cantidad increíble de recursos colaborativos para inspirar y acelerar los procesos creativos. Invito al lector interesado a explorarlos a su tiempo.

Guías de la comunidad:

Prompter Visual Notebook: Guía de Shane McGeehan, el creador de Prompter. Incluye una guía de estilo, pero también recursos sobre indicaciones, parámetros y relaciones de aspecto.(McGeehan, 2022)

Guía de Shane McGeehan, el creador de Prompter. Incluye una guía de estilo, pero también recursos sobre indicaciones, parámetros y relaciones de aspecto.(McGeehan, 2022) Guía de Estilos y Palabras Clave de Referencia de WillWulfken: otra gran guía de referencia que usa esferas como puntos de referencia.(Wulfken, 2023)

de WillWulfken: otra gran guía de referencia que usa esferas como puntos de referencia.(Wulfken, 2023) Guía de Referencia de Artistas de Aaron H: Referencias de artistas con varios medios y temas. (Holloway, 2022)

de Aaron H: Referencias de artistas con varios medios y temas. (Holloway, 2022) Guía de palabras clave y resolución de texto de Clarinet: excelente guía para la mejor redacción de indicaciones (Prompts)(Clarinet, 2022)

¿Quién es Quico?

Traer a la vida una persona que no existe no es algo nuevo para los algoritmos de IA. Para el lector no familiarizado, la página web “ThisPersonDoesNotExist” crea una persona nueva cada vez que actualizas la página usando un algoritmo conocido como Red Adversarial Generativa (GAN), que genera retratos hiperrealistas de personas completamente falsas. No obstante, mi desafío era un poco distinto. Tenía que crear este personaje en distintas escenas, posturas y situaciones.

El primer desafío fue ilustrar los personajes. Pare ello utilicé la guía “Midjourney Image Prompting”.Simplificando (mucho), puedes dar al algoritmo de Midjourney imágenes de referencia antes de la indicación textual, luego a estas imágenes les puedes dar un “peso” que determina que tanta relevancia deseas poner sobre las imágenes vs la indicación textual. En este caso creé varias imágenes de mi personaje en distintos estilos de pintura y fotografía para que el algoritmo tuviese distintos parámetros de donde tomar referencias.

Juan Bosch no describe las características especificas de los personajes, dejando que el lector se cree una imagen subjetiva de sus rostros. No obstante, va dejando algunas pistas que use como punto de partida. Por ejemplo, al describir al niño dice: “El niño era de bronce, pequeñín, con los ojos llenos de luz…”, de forma que me hice una idea de la tez de sus padres. Así mismo imagine a Quico como un joven de 28 años de edad, tez oscura, labios gruesos, pelo oscuro, etc. Luego iteré sobre varias fotos de entrada hasta que di con el resultado esperado (ver ilustración 6).

Ilustración 6

También utilicé “Clarinet’s Puppet Method”, una guía para presentar los mismos personajes como actores una y otra vez en diferentes escenas. La autora llama a este método el “títere», por una práctica similar en animación digital (ver ilustración 7).

Ilustración7

2. Espacio y Tiempo

El siguiente desafío fue crear un espacio consistente donde se desarrollaría el cuento y donde vivirían los personajes. Gran parte de la narración se desarrolla a lo largo de una gran carretera polvorienta, en un terreno árido, lleno de arbustos espinosos, con bohíos de techos bajos dispersos. Inicié iterando sobre ciento de imágenes, probando distintos estilos de pintura, tipos de luz y artistas, utilizando el “Prompter Visual Note”, hasta que me sentí satisfecho con los resultados obtenidos (ver ilustración 8 y

Ilustración 8

Ilustración 9

Palabras finales

Por último, quiero comunicar algo que es un secreto a voces, el arte es una experiencia subjetiva. La visión de cómo se traducen las escenas, oraciones y palabras viven solo en la imaginación de quien las concibe, por ende, aquí me permito un pase de libertad creativa. No obstante, en esta misma línea, quiero citar un pasaje de En busca del tiempo perdido, quizás la obra más célebre de Marcel Proust.

“Un par de alas, un sistema respiratorio diferente, que nos permitiera viajar por el espacio, no nos ayudaría en nada, ya que, si visitáramos Marte o Venus manteniendo los mismos sentidos, todo lo que pudiéramos ver se vestiría del mismo aspecto, como en la tierra. El único viaje verdadero, el único baño en la Fuente de la Juventud, sería no visitar tierras extrañas sino poseer otros ojos” (Proust, 1925)

Invito al lector a transportarse a este espacio, a intentar comprender el hecho de que estas imágenes surgen casi como una experiencia mágica, y que mi trabajo fue elegir las palabras, verbos, tamaño, forma, color, composición adecuada, hasta que, por obra y gracia del espíritu santo, me sentía feliz con el resultado arrojado por el algoritmo y la visión que perseguía.

Ramón Emilio De Jesús-Grullón

¿Qué le depara a la inteligencia artificial en el impredecible futuro? MidJourney es una muestra, una respuesta, una ventana al espacio-tiempo, a múltiples paisajes y destinos infinitos, un canvas a aquello que no sucede hasta que está escrito.

Hasta pronto,

El autor es un promptwizard (Mago de las Palabras en MidJourney) para @AmplifiedImaginationArt (Instagram).