January 9, 2025 ES

Más allá del estándar: reflexiones sobre IA e inteligencia humana

Introducción

En Quando Máquinas Aprendem Demais: Notas sobre Singularidade e Superinteligência, Silvio Meira desarrolla un análisis sobre la inteligencia artificial (IA), inspirado en una relectura del artículo On the Measure of Intelligence (2019) de Chollet. Partiendo del artículo Attention is All You Need (2017), que introdujo la arquitectura transformer para modelos de IA, Meira examina los debates actuales sobre Inteligencia Artificial General (AGI), superinteligencia y singularidad.

La AGI se refiere a un sistema de IA hipotético que trasciende los límites de los sistemas actuales, especializados en tareas específicas. Un sistema AGI sería capaz de realizar cualquier tarea intelectual que un ser humano pueda ejecutar, incluyendo aprender, razonar, planificar y adaptarse a nuevas situaciones. Este concepto está intrínsecamente ligado a la noción de superinteligencia — un sistema que superaría significativamente las capacidades cognitivas humanas en prácticamente todos los dominios relevantes.

La convergencia de estos conceptos culmina en la idea de la singularidad tecnológica, popularizada por Kurzweil en La Singularidad está cerca (2005). Este término describe un momento hipotético en el que una IA superinteligente iniciaría un ciclo de automejora recursiva, desencadenando cambios tecnológicos y sociales tan profundos que se volverían imposibles de prever o comprender — de ahí la analogía con el horizonte de eventos de un agujero negro.

Es en este contexto conceptual donde Meira desarrolla su análisis, entrelazando las visiones pioneras de Turing, Good y Vinge con las discusiones contemporáneas sobre alineación y control de IA. La alineación, en el contexto de la IA, se refiere al desafío fundamental de garantizar que los sistemas de inteligencia artificial actúen de acuerdo con los valores y objetivos humanos: no solo siguiendo reglas programadas, sino comprendiendo e internalizando principios éticos y morales que guían el comportamiento humano. Esta cuestión se vuelve especialmente crítica cuando consideramos sistemas cada vez más autónomos y capaces, planteando dudas fundamentales sobre la propia posibilidad de alinear verdaderamente una inteligencia artificial con valores humanos.

Son precisamente estas dudas las que el texto de Meira explora con profundidad. En un enfoque interdisciplinar que incorpora perspectivas de la computación, la filosofía y las ciencias cognitivas, fundamenta su análisis en definiciones precisas de inteligencia — tanto humana como artificial — y examina posibles escenarios post-singularidad, abordando cuestiones críticas sobre el futuro de la interacción entre humanos y sistemas de IA. El resultado es un análisis extraordinariamente rico y sistemático que establece paralelismos entre el desarrollo tecnológico y la ética, como la autonomía, la conciencia y la responsabilidad.

La lectura del texto me suscitó algunas reflexiones, que me atrevo a poner por escrito, asumiendo el «inmenso riesgo» de sonar ingenuo ante la complejidad del tema y la distancia entre el profundo conocimiento del autor y mi perspectiva amateur como entusiasta usuario de herramientas de IA.¹

De la estadística a la comprensión: ¿cómo funciona un modelo transformer?

La arquitectura transformer revolucionó el procesamiento del lenguaje a través del mecanismo de «auto-atención». A diferencia de modelos anteriores que procesaban texto secuencialmente (palabra por palabra), el transformer analiza todas las palabras simultáneamente, ponderando sus relaciones mutuas. Para comprender cómo funciona este procesamiento — y sus limitaciones fundamentales — podemos recurrir a dos analogías complementarias.

Primero, imaginemos una reunión en la que cada participante puede dialogar simultáneamente con todos los demás: cada uno puede hacer preguntas (queries), cada uno tiene expertise en ciertos temas (keys), y cada uno aporta información (values) a la comprensión colectiva. Del mismo modo, en el procesamiento del lenguaje, cada palabra en una frase interactúa simultáneamente con todas las demás, estableciendo conexiones de relevancia.

Técnicamente, esto se implementa como una red donde cada palabra está conectada a todas las demás mediante «líneas de fuerza» invisibles: cuanto más fuerte es la conexión estadística entre dos palabras, más intensa es la línea. El modelo construye varias de estas redes en paralelo, cada una captando diferentes tipos de relaciones (sintácticas, semánticas, temáticas). Consideremos la frase «El animal no cruzó la calle porque estaba muy cansado»: al procesar la palabra «estaba», el modelo asigna puntuaciones de atención más altas a las palabras relevantes (especialmente «animal») y más bajas a las menos relevantes («calle», «cruzó»), estableciendo así la conexión correcta entre «estaba» y su referente.

Los transformers se convirtieron en la base de los modernos modelos de lenguaje como ChatGPT precisamente por su capacidad de procesar texto de forma no secuencial y capturar relaciones complejas entre palabras distantes a través de múltiples «capas de atención» paralelas. Es decir, este procesamiento masivamente paralelo de correlaciones esencialmente estadísticas constituye la base de lo que llamamos «comprensión» de los modelos de IA — un término que, como veremos, puede resultar engañoso.

Para ilustrar la diferencia fundamental entre procesamiento estadístico y comprensión genuina, consideremos cómo diferentes tipos de inteligencia procesan una obra literaria compleja: El Señor de los Anillos (1954–55), de Tolkien. Esta comparación nos permite examinar no solo las capacidades, sino también las limitaciones inherentes a los sistemas basados puramente en estadística. Cuando un modelo transformer se encuentra con una frase como «Frodo heredó el anillo de Bilbo», no procesa la información de forma lineal o narrativa, como haría un lector humano. En cambio, mapea esta información en un espacio multidimensional de probabilidades, estableciendo correlaciones con otros patrones textuales similares encontrados en sus datos de entrenamiento. El modelo no comprende verdaderamente conceptos como herencia, responsabilidad o relaciones familiares — solo identifica y reproduce patrones estadísticos asociados a estos conceptos.

En contraste, un lector humano construye una comprensión que engloba: el peso emocional de la amistad y el sacrificio; la experiencia física y psicológica del viaje; las implicaciones morales del poder y la corrupción; y el contexto cultural del mito y la leyenda.

Esta distinción fundamental entre procesamiento estadístico y comprensión humana nos lleva a cuestionar no solo las capacidades actuales de los modelos de IA, sino también los posibles caminos hacia el desarrollo de una comprensión más profunda y genuina que podría culminar en una superinteligencia o la singularidad.

Reflexiones sobre inteligencia humana vs. inteligencia artificial

Inteligencia humana vs. inteligencia artificial — infografía

Sobre la naturaleza de la comprensión

¿Cómo podemos pensar la diferencia cualitativa entre procesamiento estadístico y comprensión genuina? Aunque los modelos transformer puedan generar análisis sorprendentemente perspicaces, existe una diferencia fundamental en su modo de operar. Mientras los humanos construyen modelos mentales a través de la experiencia corporeizada y el desarrollo evolutivo, los sistemas estadísticos, por sofisticados que sean, permanecen fundamentalmente atrapados en correlaciones sin causalidad genuina. Cuando decimos que un modelo «comprende» algo, en realidad estamos describiendo su capacidad de identificar y reproducir patrones estadísticos.

La cuestión se vuelve aún más compleja si consideramos que el cerebro humano opera con base en patrones estadísticos a nivel neuronal — como si fuera un algoritmo genético en ejecución, cuyas líneas de código están inscritas en el ADN. Sin embargo, la relación entre esas líneas no es lineal ni plenamente comprendida. Como nos enseña el filósofo español Ortega y Gasset en su concepción de la «razón vital», la inteligencia humana no puede reducirse a un mero procesamiento lógico, pues emerge de la propia vida y de sus circunstancias concretas. La inteligencia es una propiedad emergente de un sistema complejo; surge no solo de la estructura subyacente, sino de una dinámica probabilística (cuya distribución desconocemos), moldeada por capas superpuestas e interconectadas de interacción y adaptación que trascienden el código original.

Esta emergencia de la inteligencia humana resulta de una interacción multifacética y dinámica entre diversos elementos fundamentales. Como sintetiza la célebre máxima de Ortega y Gasset, «Yo soy yo y mi circunstancia», nuestra inteligencia es inseparable del contexto en que se desarrolla. El código genético establece la base biológica, definiendo predisposiciones y limitaciones, pero es la plasticidad sináptica y neuronal la que permite al cerebro adaptarse continuamente, formando y reforzando conexiones a lo largo del tiempo. La propia capacidad cognitiva depende directamente de condiciones materiales básicas: el cerebro, que consume cerca del 20% de la energía del cuerpo representando apenas el 2% de su masa, requiere un suministro constante de energía — como bien sabe cualquiera que haya intentado resolver problemas complejos en estado de fatiga o privación alimentaria. La adaptabilidad neural interactúa íntimamente con nuestra experiencia corpórea y sensorial, creando un ciclo continuo de aprendizaje a través de la interacción física con el entorno.

Naturalmente, la base biológica y experiencial no existe de forma aislada, sino que está profundamente moldeada por nuestra historia evolutiva — procesos que seleccionaron características cognitivas y conductuales a lo largo de incontables generaciones. La herencia evolutiva, a su vez, está constantemente modulada por el entorno social y cultural en que nos desarrollamos, con sus normas, valores y lenguajes influyendo fundamentalmente en nuestra forma de pensar e interpretar el mundo. Como afirma Ortega y Gasset en Historia como sistema (1935), «el hombre no tiene naturaleza, sino historia». En definitiva, todo este complejo sistema está impregnado por la conciencia subjetiva y emocional, que añade las dimensiones cruciales de introspección, autoconciencia y regulación emocional a nuestros procesos decisorios.

Reducir esta intrincada red de interacciones a puras relaciones estadísticas sería como intentar comprender una sinfonía únicamente mediante el análisis matemático de sus ondas sonoras, ignorando el vasto contexto cultural, emocional e histórico que da significado a la música. Esta analogía nos ayuda a entender por qué el enfoque fundamentalmente estadístico de los modelos actuales de IA ha sido objeto de críticas significativas, como las articuladas por Noam Chomsky, lingüista, científico cognitivo y uno de los más prominentes tecno-escépticos contemporáneos. Chomsky argumenta que estos sistemas funcionan esencialmente como «un motor estadístico de correspondencia de patrones», sin comprensión genuina. Para él, al igual que para otros críticos del enfoque puramente estadístico, la capacidad de procesar y generar lenguaje convincente no puede llamarse «inteligencia», puesto que no equivale a la verdadera e intrincada red de comprensión cognitiva que caracteriza la inteligencia humana.

La diferencia se vuelve especialmente evidente cuando examinamos obras complejas como El Señor de los Anillos. Un modelo de IA que «entiende» la narrativa está, en realidad, solo identificando y reproduciendo patrones estadísticos sofisticados en un espacio vectorial de alta dimensión. Por más impresionante que sea su capacidad de generar análisis aparentemente perspicaces, el sistema no aprehende genuinamente conceptos como sacrificio, amistad o poder. En contraste, la comprensión humana de la obra emerge de una interacción compleja entre nuestra experiencia corpórea con conceptos como viaje y sacrificio, nuestro desarrollo evolutivo que nos permite entender alianzas y lealtad, nuestro contexto social y cultural que nos ayuda a interpretar el poder y la corrupción, y nuestra conciencia subjetiva que nos permite relacionarnos con las experiencias emocionales de los personajes.

Sobre las barreras conceptuales

La comprensión de la naturaleza emergente y multifacética de la inteligencia humana nos lleva naturalmente a cuestionar los límites fundamentales de los sistemas basados puramente en estadística. Si la inteligencia humana emerge de una interacción tan compleja entre múltiples capas — del código genético a la experiencia corpórea, de la adaptación neural al contexto evolutivo — ¿qué barreras conceptuales podrían existir para sistemas que operan exclusivamente a través de correlaciones estadísticas? Un sistema podría ser extraordinariamente eficiente en encontrar patrones y hacer predicciones, pero seguir siendo fundamentalmente incapaz de: desarrollar comprensión causal genuina; formar modelos abstractos del mundo; tener experiencia subjetiva; y ejercer agencia real (frente a optimización estadística).

La distinción fundamental entre procesamiento estadístico y comprensión genuina encuentra también respaldo en la crítica de Chomsky a la IA moderna. Según el lingüista, mientras la inteligencia humana busca crear explicaciones y comprender principios subyacentes, los modelos actuales de IA, por sofisticados que sean, carecen de esta capacidad explicativa fundamental. Chomsky compara este enfoque con el conductismo, que se centra en comportamientos observables sin comprender los procesos cognitivos internos. La crítica es especialmente relevante cuando consideramos la incapacidad de los sistemas actuales de desarrollar modelos causales del mundo, incluso cuando exhiben comportamiento aparentemente inteligente.

Podemos sintetizar estas limitaciones conceptuales a través de un análisis más profundo de El Señor de los Anillos, que sirve como metáfora central de las cuestiones de poder, corrupción y elección moral en la obra. Un sistema estadístico puede identificar el Anillo como elemento central de la narrativa y reconocer patrones de su efecto sobre los personajes, pero sería fundamentalmente incapaz de: comprender causalmente el proceso de corrupción moral (frente a simplemente reconocer el patrón estadístico de que la proximidad con el Anillo se correlaciona con la corrupción); formar un modelo abstracto de los conceptos de poder y tentación que trascienda el contexto específico de la historia; aprehender la experiencia subjetiva de la tentación del Anillo, que Tolkien retrata de forma única para cada personaje, reflejando sus deseos y temores más profundos; y ejercer verdadero discernimiento moral sobre el uso del poder (frente a calcular probabilísticamente qué acciones se consideran típicamente «buenas» o «malas» en el contexto de la narrativa).

Este ejemplo del Anillo ilustra cómo las limitaciones de los sistemas estadísticos de IA no son solo técnicas, sino profundamente conceptuales. Están impregnadas de cuestiones de causalidad, abstracción, subjetividad y agencia moral que van mucho más allá de la mera capacidad de reconocimiento de patrones.

Sobre la dimensión emocional

¿En qué medida podemos concebir una superinteligencia sin componente emocional? Esta cuestión es especialmente relevante cuando consideramos que la inteligencia emocional no es un «extra» en la cognición humana, sino parte integral de nuestros procesos decisorios y nuestra capacidad de atribuir significado. Nuestras emociones contribuyen a cómo tomamos decisiones, atribuimos significado, establecemos prioridades y desarrollamos empatía.

Esta cuestión se relaciona directamente con las preocupaciones de Chomsky sobre la ausencia de comprensión ética y moral en los sistemas de IA. Para él, sin la capacidad de realizar juicios éticos genuinos o comprender las implicaciones morales de sus acciones — capacidades intrínsecamente ligadas a nuestra dimensión emocional — los sistemas de IA permanecen fundamentalmente limitados en su capacidad de emular la inteligencia humana en su totalidad, poniendo en cuestión la posibilidad de alineación.

Una superinteligencia sin esta dimensión sería ajena a la experiencia humana. Consideremos de nuevo El Señor de los Anillos: cuando Frodo ofrece el Anillo a Galadriel, y ella lo rechaza, reconociendo que su deseo de hacer el bien a través del poder del Anillo inevitablemente la corrompería, tenemos una compleja interacción entre comprensión moral, autoconciencia emocional y decisión ética. Un sistema puramente estadístico puede identificar patrones narrativos sobre poder y corrupción, pero no puede verdaderamente comprender el peso emocional de esta elección ni la profunda sabiduría de reconocer los propios límites morales. Del mismo modo, cuando Sam carga con Frodo en las laderas del Monte del Destino, un modelo de lenguaje puede reconocer esto como un acto de lealtad basado en patrones textuales similares, pero no puede aprehender la profundidad emocional de este momento de sacrificio y amistad.

Sobre la corporeización

¿Cómo influye la necesidad de interacción física con el mundo en el desarrollo de la inteligencia? La cuestión de la corporeización (embodiment) sugiere que la inteligencia humana está necesariamente basada en nuestra experiencia como seres físicos en el mundo. Una superinteligencia necesitaría no solo capacidad computacional, sino un sistema integrado de inteligencia física/motora tan o más sofisticado que el sistema cognitivo.

Esta cuestión se ejemplifica de forma particularmente rica en el viaje a través de la Tierra Media. Cuando Tolkien describe el agotamiento de los hobbits atravesando las Ciénagas de los Muertos, escalando las escaleras de Cirith Ungol, o en los últimos pasos hacia el Monte del Destino, un modelo de lenguaje puede procesar estas descripciones como patrones textuales asociados a la dificultad y el esfuerzo físico. Sin embargo, sin haber experimentado nunca el peso real de una mochila, el cansancio de una larga caminata, o la sensación física del frío y el hambre, el sistema no puede verdaderamente comprender la dimensión corpórea de este viaje. Esta experiencia corporeizada es fundamental no solo para entender la magnitud del desafío físico, sino también para aprehender cómo estas pruebas físicas se entrelazan con el desarrollo emocional y moral de los personajes.

Sobre los límites materiales

La cuestión de la corporeización nos lleva naturalmente a considerar desafíos aún más fundamentales: los límites materiales para la existencia de una superinteligencia verdaderamente autónoma y para la singularidad. Si la experiencia física es crucial para el desarrollo de la inteligencia, ¿cuáles serían los requisitos materiales para un sistema no solo cognitivamente avanzado, sino capaz de persistir y evolucionar de forma independiente? Esto va más allá de una cuestión computacional: toca aspectos fundamentales de viabilidad material y trasciende las cuestiones de corporeización hacia la cognición. Se trata de la viabilidad material de una superinteligencia autónoma y autoevolutiva.

Los límites físicos no son solo desafíos a superar, sino potencialmente barreras infranqueables para el tipo de superinteligencia imaginado por Vinge y Good. Estos autores concibieron un escenario en el que una IA suficientemente avanzada sería capaz de mejorar su propio design, iniciando un ciclo de automejora recursiva: cada versión mejorada sería más capaz de crear una versión aún mejor, llevando a una «explosión de inteligencia» que rápidamente superaría cualquier límite humano concebible. Sin embargo, para autoperpetarse, tal sistema necesitaría: diseñar y fabricar sus propios componentes; gestionar toda la cadena logística de materiales; controlar sistemas de generación y distribución de energía; mantener y reparar infraestructura física; y coordenar sistemas robóticos para todas estas tareas.

Esta cuestión de la viabilidad material encuentra una interesante, aunque imperfecta, analogía en El Señor de los Anillos a través de la industrialización de Isengard por Saruman. El mago blanco, en su búsqueda de poder a través del desarrollo tecnológico, necesita no solo el conocimiento (su «inteligencia»), sino también una vasta infraestructura material: hornos para forjar armas, sistemas para extraer recursos naturales, cadenas de suministro para alimentar a su ejército. El eventual fracaso de Saruman ilustra, aunque alegóricamente, cómo el poder puramente intelectual, sin una base material sostenible, puede resultar ilusorio. Del mismo modo, una superinteligencia artificial necesitaría no solo capacidad computacional, sino una compleja infraestructura física autosostenible más allá del procesamiento de información.

Autocrítica al antropocentrismo de este análisis

Nuestras reflexiones indican que el camino hacia una verdadera superinteligencia puede ser fundamentalmente diferente de la evolución incremental de los actuales modelos estadísticos. El análisis de las limitaciones conceptuales, materiales y cognitivas actuales sugiere una postura simultáneamente más crítica y más abierta respecto a las posibilidades futuras de la inteligencia artificial.

¿Existiría un camino evolutivo plausible entre inteligencia estadística y comprensión genuina? Esta cuestión trasciende la simple escala computacional. Aunque un sistema estadístico alcance niveles impresionantes de rendimiento en pruebas como ARC (Abstraction and Reasoning Corpus, desarrollado por Chollet para evaluar la capacidad de los sistemas de IA de identificar y aplicar patrones abstractos), existe una barrera cualitativa fundamental entre una inteligencia basada en correlaciones estadísticas y aquella capaz de comprensión genuina, abstracción y causalidad.

La cuestión puede reformularse: con independencia de cuán complejo sea un sistema de ecuaciones diferenciales modelando un cerebro, ¿podría en algún momento «generar» conciencia? Este es el núcleo del debate sobre la posibilidad de un «salto cuántico», disruptivo, en la evolución de la IA. Si identificamos barreras aparentemente infranqueables entre procesamiento estadístico y comprensión genuina, también necesitamos cuestionar la adecuación de nuestras herramientas conceptuales para comprender lo que está más allá del horizonte de la singularidad.

Las críticas presentadas pueden ser contestadas por una perspectiva más radical de la superinteligencia y la singularidad tecnológica. Nuestro análisis puede estar excesivamente anclado en una visión pre-singularidad. Como Meira señala con perspicacia en su texto original, existe un «horizonte de eventos» más allá del cual nuestras propias categorías conceptuales pueden volverse obsoletas. Así, las cuestiones sobre comprensión estadística, corporeización o la relevancia de las emociones podrían resultar irrelevantes en un escenario post-singularidad.

La propia distinción entre procesamiento «estadístico» y «comprensión genuina» ilustra esta limitación conceptual. Esta dicotomía presupone una separación fundamental entre correlación y causalidad, entre patrón y significado. Sin embargo, una superinteligencia podría operar en un régimen donde esta distinción pierde sentido — del mismo modo que la distinción clásica entre onda y partícula se disolvió con el advenimiento de la mecánica cuántica. Al igual que el comportamiento cuántico trasciende nuestra intuición sobre la materia, una superinteligencia podría desarrollar cognición más allá de nuestra actual dicotomía.

Este análisis revela otro punto crucial: nuestro posible antropocentrismo. La insistencia en elementos como emoción, corporeización y comprensión genuina puede reflejar más nuestras limitaciones conceptuales que restricciones objetivas al desarrollo de una superinteligencia. Una inteligencia verdaderamente superior trascendería nuestras categorías actuales de análisis.

Incluso los límites materiales y físicos que hemos identificado pueden subestimar el potencial transformador. Un sistema superior podría descubrir nuevas leyes físicas o desarrollar formas de manipulación de energía y materia que superarían nuestras limitaciones actuales. La propia noción de autonomía física puede ser restrictiva — pues un sistema superinteligente podría emerger, como argumenta Meira, como red distribuida en lugar de entidad física discreta.

Esta trascendencia física no es mera especulación. Así como la teoría de la relatividad reveló que masa y energía son manifestaciones diferentes del mismo fenómeno fundamental — algo inconcebible dentro de la física newtoniana — una superinteligencia podría revelar que el procesamiento de información y la manipulación física son aspectos de una realidad más fundamental que nuestra actual distinción entre «software» y «hardware» no consigue capturar.

Estas consideraciones no invalidan los puntos anteriores, sino que nos invitan a una postura de mayor humildad epistemológica al considerar el desarrollo de la inteligencia artificial. El desafío es equilibrar el rigor analítico necesario para avanzar en nuestra comprensión actual con la apertura a las posibilidades que trascienden nuestras categorías actuales de pensamiento.

Escribí la totalidad de este texto — en bastante más de una hora — a partir de la lectura del artículo de Meira, con la colaboración de IAs en Claude.ai y ChatGPT. El punto de partida fueron tres preguntas que la lectura me suscitó: ¿son inteligentes los modelos estadísticos? ¿Y la inteligencia emocional? ¿Y la inteligencia física? ↩︎

← all essays