Aunque a principios de este año Las tecnologías llamadas “inteligencia artificial” mostraron un avance muy notable, no son nuevas, su desarrollo se puede rastrear hasta los principios de los años setenta del siglo pasado. Sin embargo, en los últimos meses hemos asistido a un boom de inteligencias artificiales generadoras de uso público. Se llaman generadoras porque los nuevos desarrollos han logrado que las aplicaciones sean creativas, es decir, que produzcan nueva información, no solo que recombinen la información preexistente. En pocas semanas se han lanzado aplicaciones que escriben textos, crean imágenes, hacen presentaciones, componen canciones, crean campañas publicitarias y hasta lideran empresas.

¿Cómo funciona todo esto? Trataremos de pergeñar una breve explicación.

Existen varios modelos de inteligencia artificial, entre los más populares se encuentran las redes neuronales, el aprendizaje profundo, los algoritmos genéticos, los filtros adaptativos y los sistemas expertos. ChatGPT-3, la primera inteligencia artificial generadora conocida por el gran público es una red neuronal.

¿Cómo hace lo que hace ChatGPT-3? ¿Cómo logra producir textos coherentes sobre casi cualquier cosa en cuestión de segundos? Una red neuronal es una colección de instancias numéricas interconectadas por capas, en las que todas las salidas de una capa están conectadas con todas las entradas de la capa siguiente. Cada instancia genera sus salidas multiplicando las entradas por un número y sumándoles una constante (Una función lineal)

Arquitectura de una red neuronal

Los números de la entrada estimulan una “onda” de información que se propaga por toda la red hasta entregar un valor o un conjunto de valores en la salida.

¿Cómo puede un artilugio matemático/numérico como estos producir textos?

Veamos, a cada palabra del idioma se le asigna un único valor numérico. ChatGPT está diseñado para a partir de un conjunto ordenado de palabras, un texto, obtener una lista de las diez palabras siguientes más probables (con un valor de probabilidad asociado), luego una función llamada heat (calor) se encarga de elegir cuál será la siguiente palabra. Esto se hace así porque si solo se eligiese la palabra más probable, el resultado sería un texto muy plano y predecible. El proceso se repite iterativamente hasta que se llega al punto final. Vale aclarar que en realidad además de las palabras se consideran los signos de puntuación y otras unidades de sentido como los prefijos y los sufijos, pero para simplificar la explicación les vamos a decir palabras, que son las más frecuentes.

Cada palabra genera una huella numérica en la miríada de instancias de la red, es como una marca identitaria. En este universo, si lo imaginamos como un espacio vectorial de millones de dimensiones, cada palabra ocupa un “lugar”; las palabras semánticamente afines se encuentran cerca entre sí. Por ejemplo, pera y manzana deben estar matemáticamente muy cerca, mientras que gobierno y hemoglobina están mucho más lejos.

Para que todo esto funcione, el entrenamiento es la clave. ChatGPT-3 es una red neuronal que tiene ciento setenta y cinco mil millones de instancias numéricas. Se considera que el cerebro humano tiene alrededor de cien mil millones de neuronas. Es una red neuronal titánica, un idioma de cincuenta mil palabras cabe tres millones y medio de veces en dicha red. A esta red neuronal primero se la configuró en modo entrenamiento, esto es, se la puso a predecir una a una la siguiente palabra de textos humanos existentes, miles de millones de palabras pertenecientes a decenas de millones de textos fueron pasando por la red neuronal. Mediante algoritmos de optimización, como el de los mínimos cuadrados, la red va modificando el valor de sus coeficientes, buscando minimizar la distancia multidimensional (maximizar la similitud) entre la palabra predicha por el software y la palabra del texto humano de entrenamiento. Con el tiempo y el entrenamiento la red neuronal aprende a escribir muy semejante a como lo haría un ser humano.

Si uno se asoma a escudriñar los valores almacenados en una capa intermedia de la red, estos resultarían ininteligibles, inclusive para los ingenieros que programaron la aplicación. ChatGPT-3 no entiende las palabras como las entendemos nosotros. Sin embargo, logra componer textos mucho mejores a un solo intento de lo que logra hacer un humano promedio.

Es el poder de los grandes números, ChatGPT-3 tiene el tamaño de 1,75 cerebros humanos y está diseñado para hacer muy bien una sola tarea, elegir la siguiente palabra de un texto, el entrenamiento de miles de millones de palabras por segundo durante días y días hace que en la red se vayan codificando, de un modo desconocido para los humanos, las reglas de la gramática y de la retórica.

Pero aquí no acaba la cosa, ChatGPT-4 la nueva versión de la empresa OpenAI tiene el tamaño de diez cerebros humanos, un billón de instancias numéricas (neuronas). ChatGPT-4 es multimodal, trabaja con texto, audio e imagen. Sometida la aplicación a múltiples exámenes estandarizados de conocimientos en los más diversos campos: Psicología, Derecho, Biología, inglés, Matemáticas, Economía, Medicina entre otros. ChatGPT-4 solo ha sido derrotada por los expertos humanos y por márgenes estrechos en los exámenes de computación cuántica y sentido común (Ver figura 2).

Una limitante fuerte que tienen estas tecnologías, por ahora, es el consumo energético. Una aplicación como estas puede tener un mejor desempeño que un cerebro humano, pero mientras el cerebro humano emplea cerca de 12 vatios, Una IA puede consumir tranquilamente entre doscientos vatios y un kilovatio por instancia y todo el servidor puede consumir con facilidad algunos megavatios. El cerebro humano es mucho más eficiente energéticamente debido a su arquitectura. Nuestras neuronas cumplen simultáneamente las funciones de procesamiento y almacenamiento de memoria, cosas que la arquitectura hardware de las nuevas IA no puede hacer aún. Es esperable eso sí una continua mejora en estos aspectos.

A lo largo de la historia los humanos hemos desarrollado la tecnología para expandir nuestras posibilidades, para hacernos más y más poderosos como sostiene Yuval Harari. Nos hemos hecho más fuertes, más rápidos, más precisos, más hábiles y hemos mejorado los sentidos. Con las IA-Generadoras podríamos ser también más inteligentes, mucho más inteligentes. El desarrollo vertiginoso de las IA generadoras nos anticipa que esto es solo el principio.

Estas nuevas tecnologías que imitan hasta cierto punto el cerebro humano y cuyas fortalezas y debilidades son además semejantes a las del cerebro, nos van a permitir dilucidar aspectos claves sobre los procesos del pensamiento humano. En 1970 Jhon Conway lanzó un juego llamado el juego de la vida. Usando la lógica de los autómatas celulares y unas reglas sencillas, logró producir patrones de una gran complejidad. Tal vez nuestro cerebro se rige por reglas sencillas y toda la maravilla del pensamiento, la conciencia, la creatividad y la sensibilidad, no son más que el resultado de unas redes neuronales super optimizadas a lo largo de millones de años de evolución. El panorama es amenazante y al mismo tiempo emocionante.

Estamos, según algunos analistas, entrando en La singularidad. La singularidad es el nombre que ha recibido el hecho de que la inteligencia artificial supere la inteligencia humana hasta el punto en que pueda diseñarse y perfeccionarse a sí misma, prescindiendo de la intervención humana e incrementando de manera exponencial sus capacidades, es decir, su poder. ¿Podrán los super-cerebros artificiales convertirse en poderes que gobiernen la vida de los hombres?; ¿Es posible que en algún momento del desarrollo las IA adquieran conciencia de su propia existencia?; ¿Se convertirán en dioses como lo propone Harari?; ¿Tendrán las tecno-religiones de Silicon Valley un papel que cumplir en el devenir de la historia? Las certezas se evaporan ante la incertidumbre de la transición. Todo está muy reciente, estas tecnologías avanzan a pasos agigantados. Por fortuna todavía no podemos decir que sean autoconscientes. Pero, ¿qué es la conciencia? ¿si una máquina biológica puede producir la conciencia por qué no habría de lograrlo una máquina artificial? ¿tenemos un hálito de divinidad que nos separa, aunque sea mínimamente, de las posibilidades del mundo de la materia? Ojalá logremos dilucidar estas preguntas en el mediano plazo, mientras tanto, debemos permanecer atentos a su desarrollo y no perder de vista los desafíos antropológicos, filosóficos y hasta teológicos que este nuevo salto tecnológico de la humanidad plantea.