Derecho y NBIC

El Derecho de NBIC es una materia transversal, relacionada con tecnologías convergentes (Nanotecnologías, Biotecnologías, Tecnologías de la Información y ciencias Cognitivas). Enfatizan la creciente interconexión entre lo infinitamente pequeño (N), la creación de seres vivos (B), las máquinas pensantes (I) y el estudio del cerebro humano (C). Inciden en la ciencia y el derecho, tornando complejo establecer sus límites, desafíos y consecuencias económicas, político- sociales y éticas.

viernes, 1 de agosto de 2025

PROYECTOS EUROPEOS EN SERVICIOS HABILITADOS POR IA EN SALUD DIGITAL EN EL CONTINUO DEL BORDE DE LA NUBE ("EDGE-TO-CLOUD CONTINUUM") . HADEA.

Por: Carlos A. FERREYROS SOTO

Doctor en Derecho

Universidad de Montpellier I Francia.

cferreyros@ferreyros-ferreyros.com

Resumen

HaDEA (European Health and Digital Executive Agency) gestiona actualmente más de 900 proyectos relacionados con inteligencia artificial (IA), muchos de los cuales abordan el desarrollo y aplicación de servicios habilitados por IA en el continuo del borde a la nube ("edge-to-cloud continuum") en áreas clave como salud, fabricación, observación de la Tierra y sistemas cognitivos distribuidos.

Los principales líneas y ejemplos de proyectos del "edge-to-cloud continuum" gestionados por HaDEA son:

· Cognitive Computing Continuum: Proyectos como ENACT desarrollan arquitecturas para gestionar recursos de manera óptima y escalar aplicaciones “hiper-distribuidas”. Utilizan redes neuronales gráficas y algoritmos de aprendizaje profundo para indicar configuraciones de despliegue óptimos, mejorando las competencias digitales europeas y la calidad de los servicios TI.

· Cognitive Fog Computing: COGNIFOG ofrece un marco de "cognitive fog" para monitorear y analizar flujos de datos a lo largo del IoT-edge-cloud continuum, usando servicios de análisis basados en IA cerca del origen de los datos (en el borde o edge), lo que permite respuestas en tiempo real y mejora la eficiencia energética y la escalabilidad de las aplicaciones inteligentes.

· Federated Learning y privacidad: El proyecto FLUTE impulsa métodos de aprendizaje federado y mecanismos de compartición de datos orientados a la privacidad en entornos descentralizados, permitiendo el entrenamiento de modelos de IA sin concentrar datos sensibles en un solo centro, relevante para casos médicos y de diagnóstico de alto valor añadido.

En síntesis, los proyectos gestionados por HaDEA orientados al continuum edge-cloud exploran soluciones de IA distribuidas que mejoran la toma de decisiones, la eficiencia operativa, la privacidad y la capacidad de respuesta en múltiples sectores, siguiendo una visión europea de infraestructura digital segura, interoperable y ética.

A fin de acceder a normas similares y estándares europeos, las empresas, organizaciones públicas y privados interesados en asesorías, consultorías, capacitaciones, estudios, evaluaciones, auditorías sobre el tema, sírvanse comunicar al correo electrónico:cferreyros@ferreyros-ferreyros.com

____________________________________________

ICE2025: conozca los proyectos gestionados por la Agencia Ejecutiva Europea de Salud y Digital (HaDEA) que trabajan en servicios habilitados por IA en el continuo del borde de la nube.

La Conferencia Internacional de Ingeniería, Tecnología e Innovación 2025 (ICE2025) fue un evento inspirador, donde los participantes presentaron y debatieron las últimas tendencias en transformación digital. Durante la conferencia, se organizaron 14 sesiones temáticas especiales, donde se exploraron las sinergias entre los proyectos en curso y se debatieron los retos futuros. Una de las sesiones especiales (SS14 - Sesión Especial: Continuidad de la Computación Cognitiva) fue presidida por el proyecto ENACT, gestionado por HaDEA, con la participación de otros seis proyectos financiados por la UE, también gestionados por HaDEA, seleccionados en la convocatoria Horizonte Europa 2023 sobre Continuidad de la Computación Cognitiva: Inteligencia y automatización para un procesamiento de datos más eficiente.

Si bien todos estos proyectos son complementarios en sus objetivos de investigación, es crucial analizar periódicamente las líneas de investigación que se solapan y diferencian, lo que puede dar forma a las perspectivas tecnológicas futuras. Con este fin, tras más de 18 meses de implementación, nuestros proyectos durante la sesión especial han concluido lo siguiente:

Definir estrategias desde el principio para conceptualizar y gestionar recursos dentro del Continuo de la Computación Cognitiva es clave para ofrecer soluciones exitosas a los usuarios finales. Por ejemplo, considerar los recursos como colectivos autónomos específicos o enjambres dinámicos tiene diferentes implicaciones en términos de tiempo de ejecución e implementación.
Ciertos casos de uso que pueden manejar datos sensibles, como la salud electrónica o la fabricación, imponen restricciones sobre dónde deben almacenarse e implementarse los datos y los componentes del servicio. Por ejemplo, las ubicaciones geográficas predefinidas plantearán diversos desafíos para la gestión dinámica de recursos.
Uno de los principales desafíos para el desarrollo de estas tecnologías es la falta de conjuntos de datos reales y de acceso abierto que puedan usarse para entrenar modelos de orquestación basados en IA.
Para la futura interoperabilidad y sostenibilidad de los servicios, es crucial utilizar marcos de modelado estándar y de código abierto como TOSCA (Especificación de Topología y Orquestación para Aplicaciones en la Nube). Sin esta representación estándar, la gestión de recursos en el borde de la nube en diferentes casos de uso se vuelve muy compleja. Además, los proyectos de la UE pueden desempeñar un papel crucial al participar en el trabajo de los comités técnicos, dando forma a los futuros esfuerzos de estandarización.
La incorporación de soporte para diversos espacios de datos de código abierto e infraestructuras de datos federadas en el dominio del servicio es clave para el éxito futuro.

Los proyectos:

COGNETS tiene como objetivo revolucionar la gestión de infraestructura inteligente mediante la introducción de un marco de middleware distribuido escalable e interoperable para la computación autónoma de IoT en la nube, sostenible durante y después del proyecto.
EMPYREAN tiene como objetivo establecer asociaciones, un paradigma de computación hiperdistribuida, aprovechando dispositivos IoT colaborativos y heterogéneos y recursos informáticos y de almacenamiento federados que pueden pertenecer a diferentes usuarios.
ENACT está desarrollando un Continuum de Computación Cognitiva que puede abordar las necesidades de gestión óptima de recursos y escalamiento dinámico. Al aprovechar el poder de las Redes Neuronales Graficas impulsadas por IA y los agentes de Aprendizaje Profundo por Refuerzo, el proyecto sugerirá configuraciones óptimas de implementación para aplicaciones hiperdistribuidas. Los resultados de estas actividades de investigación y desarrollo mejorarán las competencias de las empresas europeas y modernizarán los servicios de TI.
HYPERAI trabaja con entidades informáticas virtuales inteligentes (nodos) que provienen de una variedad de infraestructuras que abarcan las tres capas del llamado continuo informático: la nube, el borde y la IoT.
INTEND se propone ofrecer once herramientas de software innovadoras que se integren en un conjunto de herramientas INTEND. El enfoque y las herramientas se probarán y validarán en cinco dominios verticales para lograr la novedosa operación de datos basada en intención para canales de transmisión de video, plataformas de datos de máquinas, infraestructura de datos 5G, espacio de datos urbanos y aplicaciones de IA robótica.
MYRTUS tiene como objetivo desbloquear la nueva dimensión viva de los sistemas ciberfísicos (CPS), adoptando los principios de la Iniciativa TransContinuum e integrando plataformas de computación en la nube, en la niebla y en el borde.
SWARMCHESTRATE trabaja en la autoorganización de los llamados enjambres de unidades interdependientes en un espacio de orquestación dinámico. Los enjambres serán gestionados por agentes de orquestación descentralizados con soluciones confiables basadas en blockchain, algoritmos criptográficos de vanguardia y análisis de datos que preservan la privacidad.

Fondo

La computación en la nube es uno de los componentes clave para dar forma al futuro digital de Europa. Se prevé que la Comisión Europea proponga la Ley de Desarrollo de la Nube y la IA en 2025, con el potencial de triplicar la capacidad de los centros de datos de la UE, para cerrar la brecha de capacidad en comparación con EE. UU. y China. Al mismo tiempo, también se pronostica que, si bien el 20 % de la computación futura se realizará en centros de datos, es decir, en el entorno de la nube, alrededor del 80 % de la computación se ejecutará en dispositivos inteligentes más cercanos al usuario, es decir, computación de borde. Esta computación de borde en la nube también implicará el entrenamiento, el ajuste y la ejecución de varios modelos de IA en un entorno heterogéneo y dinámico. Esto requerirá soluciones tecnológicas, donde el sistema sea capaz de percibir su entorno, optimizarlo en tiempo real y aprender a adaptar dinámicamente sus cargas computacionales, es decir, lo que se conoce como Cognitive Computing Continuum.

Horizonte Europa es el programa de investigación e innovación de la UE para el período 2021-2027.

Detalles

Fecha de publicación: 18 de julio de 2025
Autor: Agencia Ejecutiva Europea de Salud y Digital

Sector del programa

Digital

Programa

Clúster 4 de Horizonte Europa: Digital

jueves, 31 de julio de 2025

SOBRE LA FIABILIDAD DE LOS SISTEMAS DE INTELIGENCIA ARTIFICIAL.

Por: Carlos A. FERREYROS SOTO

Doctor en Derecho

Universidad de Montpellier I Francia.

cferreyros@ferreyros-ferreyros.com

Resumen

El documento critica un común supuesto en el campo de la inteligencia artificial: un alto rendimiento en el laboratorio no implica automáticamente la fiabilidad del sistema. Si bien los modelos de aprendizaje profundo han mostrado mejoras en la gestión de ciertos desafíos controlados (como la robustez ante distribuciones de datos específicas, como las de ObjectNet), el problema subyacente de fiabilidad persiste. Cuando las redes neuronales artificiales (RNA) se encuentran con entradas desconocidas o contradictorias, a menudo fallan, al proporcionar predicciones de alta certeza, incluso en escenarios en los que idealmente deberían reconocer anomalías o incertidumbre. Esto pone de relieve un problema fundamental: los sistemas de IA actuales suelen carecer de autoconciencia respecto a los límites de su propia competencia.

Para que las herramientas de IA sean verdaderamente fiables, deben ir más allá de simplemente procesar entradas y obtener resultados. El documento establece un requisito claro: una IA fiable debe ser capaz de cumplir con éxito su tarea o reconocer explícitamente fallos. Esto implica internalizar la comprensión de que los datos de entrada observables (como imágenes u otra información de sensores) son solo una manifestación superficial de procesos subyacentes más profundos. Por lo tanto, un sistema fiable debe estar equipado no solo para analizar e interpretar los datos de entrada, sino también para formular hipótesis sobre los mecanismos subyacentes. Si una entrada no se ajusta a los patrones esperados o contiene incongruencias, el sistema debe generar una excepción de forma robusta, alertando a los usuarios o cerrándose en lugar de ofrecer resultados potencialmente engañosos.

En resumen, la confiabilidad en IA requiere más que predicciones de alta precisión sobre tareas familiares. La IA no sólo debería generar resultados, sino también tener mecanismos para reconocer y señalar cuando encuentra anomalías o situaciones fuera de su competencia. También debería no solamente incorporar el conocimiento previo del diseñador sino ampliar la innovación y la capacidad del sistema para aprender o encontrar nuevos patrones de datos puesto que la verdadera confiabilidad proviene de sistemas que formulan hipótesis sobre los procesos generadores detrás de los datos, no solo de sistemas que se destacan en las asignaciones de entrada y salida. Este artículo propone un cambio de enfoque desde las métricas de evaluación tradicionales hacia una comprensión más profunda a nivel de proceso y un manejo de excepciones en la inteligencia artificial.

El presente artículo publicado en ACM Digital Library, fue traducido del inglés al castellano por el suscrito con la ayuda del aplicativo Google Translator. Se adjunta copia en su versión original al final y el enlace al texto en Internet: https://dl.acm.org/doi/10.1145/3688671.3688786

____________________________________________

SOBRE LA FIABILIDAD DE LOS SISTEMAS DE INTELIGENCIA ARTIFICIAL

Autor
Stasinos Konstantopoulos

Abstract

Este artículo propone un conjunto de requisitos técnicos concretos para métodos de inteligencia artificial fiables. Si bien estos requisitos no abarcan las dimensiones sociales, éticas ni regulatorias, sí abarcan los aspectos técnicos del ciclo de vida completo de un sistema de IA, desde su diseño y monitorización y control operativo hasta su comportamiento en caso de fallo. El artículo concluye con un esquema para un plan de investigación ambicioso pero realista que puede impulsar el estado del arte hacia sistemas de IA fiables.

1 Introducción

A medida que las tecnologías de inteligencia artificial (IA), y en particular el aprendizaje automático (AA), alcanzan la madurez necesaria para su aplicación generalizada, el debate sobre las salvaguardias y políticas necesarias cobra cada vez mayor impulso. Este debate suele combinar múltiples dimensiones bajo el término de IA fiable: la evaluación técnica de las tecnologías de IA en cuanto a su idoneidad para el propósito; las políticas que se les pide a los operadores humanos que implementen y la responsabilidad de estos operadores respecto a la fidelidad y acierto con que las implementan; y los puntos de acceso que ofrece el sistema a sus operadores humanos para supervisar y controlar eficazmente un sistema implementado.

En este artículo, analizaremos el concepto de fiabilidad. Si bien la fiabilidad por sí sola no abarca completamente lo que suele entenderse como fiabilidad de la IA, sí abarca todas sus dimensiones:

• La fiabilidad no se cubre completamente con la precisión de la medición y las métricas de rendimiento relevantes. Para ser fiable, un sistema debe cubrir requisitos no funcionales, como la degradación gradual (en lugar del colapso) en condiciones de implementación adversas, la mantenibilidad y la robustez a lo largo del tiempo.

• El diseño para la testabilidad (DFT), principalmente en microelectrónica, consiste en añadir características ya en fase de diseño que no satisfacen los requisitos funcionales, pero que facilitan la prueba del sistema y el diagnóstico de fallos.

• Capacitar a los operadores humanos para la monitorización y el control mediante los medios que les ofrece el sistema para diagnosticar fallos y reaccionar ante ellos.

El objetivo de este documento de posición es interpretar estos objetivos generales como requisitos técnicos concretos y argumentar que los requisitos propuestos son ambiciosos pero realistas.

2 Monitoreo y Control

Aunque el término inteligencia artificial abarca una amplia variedad de algoritmos, lo que suele preocupar en el contexto de la confiabilidad son las redes neuronales artificiales (RNA) conexionistas o de inspiración neurológica. Estos sistemas codifican el conocimiento en forma de una red compleja de nodos de procesamiento simples, de modo que las decisiones que toma el sistema dependen de cómo interactúan los nodos y no del procesamiento que se realiza en cada uno de ellos.

En el estado actual de la técnica, las RNA con millones de nodos pueden construirse con hardware informático básico, mientras que las instancias principales de RNA superan los 100 mil millones de nodos. Dado que la lógica detrás de cada decisión se distribuye por toda la red, a estas escalas es imposible monitorear o controlar las RNA mediante ingeniería de software convencional. Es decir, es completamente imposible para un ingeniero seguir los pasos del procesamiento desde las entradas hasta las salidas y, más aún, controlar las salidas editando directamente el programa, los parámetros (pesos) de las conexiones.

Como resultado, el monitoreo se limita a medir errores en sus salidas. El control también se limita a decidir sobre la arquitectura de red, establecer la tasa de aprendizaje y otros hiperparámetros, y aumentar o mejorar el conjunto de datos de entrenamiento. Estas son decisiones importantes que pueden afectar drásticamente el rendimiento, y las revisaremos más adelante en el contexto de los grados de libertad ofrecidos a los desarrolladores de sistemas. Sin embargo, en el contexto actual de la operación de una implementación, no se puede esperar de forma realista que el sistema pueda rediseñarse y reentrenarse para solucionar fallos menores. La única acción que el operador de campo puede realizar es ignorar o apagar el sistema y devolverlo para su rediseño y reentrenamiento, posiblemente adjuntando los puntos de datos que demuestran el fallo.

Desde el punto de vista de la fiabilidad, esto genera dos problemas: provoca la indisponibilidad del sistema incluso en fallos menores que en otros sistemas técnicos normalmente se abordarían de inmediato; y debilita el canal de retroalimentación de soluciones alternativas e improvisaciones, que es invaluable para la mejora iterativa.

Para dar un ejemplo de un sistema de aprendizaje automático interpretable y editable, considere GAM Changer [28]. GAM Changer aplica Modelos Aditivos Generalizados (GAM) al ámbito médico y permite a los médicos analizar, validar y editar intuitivamente los modelos para que sus comportamientos se ajusten a sus conocimientos y valores. Naturalmente, esto se facilita principalmente porque los GAM son la combinación lineal de los valores de entrada, un modelo sencillo e intuitivo. Aplicar parches manualmente a las implementaciones de ANN sería mucho más complicado.

REQUISITO: Para aprovechar al máximo el círculo virtuoso de mejora iterativa a través del uso, las implementaciones activas deben poder contribuir no solo con datos de entrenamiento sino también con improvisaciones y soluciones alternativas desarrolladas localmente, que luego el proveedor generaliza en mejoras para todas las implementaciones.

3 El rendimiento en el laboratorio no es sinónimo de fiabilidad

Las RNA clásicas cuentan con tres capas de nodos completamente conectados, pero la reciente revolución del aprendizaje profundo ha expandido los nodos a lo largo de una arquitectura más profunda, con más de las tres capas teóricamente requeridas. Se ha descubierto que las diferentes arquitecturas de aprendizaje profundo presentan sus respectivas ventajas e inconvenientes para diferentes aplicaciones, pero en todos los casos, una RNA profunda tendrá un número considerablemente menor de posibles configuraciones de conexión que una RNA completamente conectada y, por lo tanto, se pueden entrenar redes mucho más grandes de forma realista. Este es un desarrollo muy prometedor, no solo porque ha permitido escalar las redes profundas, sino también porque las capas son, en realidad, niveles de representaciones cada vez más abstractas de los datos de entrada [4, 5]. Esto ya reduce la opacidad de las RNA y ofrece oportunidades para la inspección y manipulación humana.

Los recientes avances en visión artificial son un excelente ejemplo de cómo la arquitectura puede tener profundos efectos en el comportamiento del sistema. En visión artificial, la arquitectura lineal y sencilla de Redes Neuronales Convolucionales (CNN) dominó originalmente el estado del arte [16, 26], pero fue reemplazada por arquitecturas más complejas de Redes Neuronales Residuales (ResNet), que incluyen conexiones que implementan capas recurrentes y omisión de capas [11, 17, 27]. En un desarrollo paralelo, la arquitectura YOLO replantea el concepto de convolución para superar la incapacidad de las CNN originales para considerar adecuadamente el contexto [22], y sus últimas ediciones también logran resultados de vanguardia.

Lo importante de la cronología anterior es que, si bien las redes aumentan de tamaño con el tiempo, no fueron solo las redes más grandes las que lograron avances significativos en rendimiento, sino también una comprensión cada vez mejor del comportamiento de las diferentes arquitecturas y la acumulación de experiencia sobre cómo diseñar arquitecturas que enfaticen los beneficios relevantes para la aplicación en cuestión. Esto corrobora la importancia del primer requisito mencionado, aunque en este contexto las mejoras fueron resultado de la experiencia adquirida mediante la experimentación en laboratorio, más que de las implementaciones. Sin embargo, el argumento es, una vez más, que la mejora no se logró mediante la exposición de un aprendiz de caja negra a datos cada vez más complejos y voluminosos, sino mediante la ingeniería directa de su estructura.

A pesar de estos avances, las RNA siguen siendo relativamente frágiles, lo que se manifiesta tanto en el conjunto de datos ObjectNet como en los ataques adversarios. ObjectNet es una colección de imágenes de objetos domésticos comunes fotografiados desde ángulos extraños o colocados de formas extrañas, como boca abajo. Las pruebas de vanguardia en ObjectNet han arrojado precisiones que son la mitad de las reportadas en los conjuntos de datos habituales [2], lo que demuestra cómo todos los sistemas de visión artificial no logran capturar las propiedades esenciales de estos objetos y se basan en pistas visuales superficiales.

Desarrollos posteriores, como Visual Transformers (ViT), han aumentado considerablemente su robustez en ObjectNet [8], pero la afirmación anterior sobre su falta de robustez se mantiene, como lo demuestran los ataques adversarios desarrollados posteriormente a su introducción [29]. Los ataques adversarios también explotan el hecho de que las RNA no analizan ni verifican la validez de sus decisiones. Cada capa es una función matemática que asigna matrices de valores a otros valores, y la red completa asigna una matriz de valores RGB a un valor de decisión sin conectar estas salidas a ningún sistema más amplio de conocimiento sobre el mundo y los objetos que lo componen. Los ataques adversarios perturban las imágenes al desplazar ligeramente los valores RGB hacia valores que generan características (salidas de la capa intermedia) que impulsan la decisión hacia un objeto diferente. Donde un humano reconocería inmediatamente el objeto correcto, quizás con colores un poco extraños, la RNA tomará decisiones absurdas con confianza. Se ha demostrado que los ataques adversarios reducen la precisión de las redes de última generación (tanto las basadas en CNN como en ResNet) a la mitad o incluso menos, y comprender y mitigar completamente este fenómeno es una cuestión de investigación abierta [1]. Finalmente, los ataques adversarios no se limitan a la visión artificial, sino que son omnipresentes en todo el espectro de aplicaciones de aprendizaje profundo [6, 9, 10, 14]. Se espera que los ingenieros de aprendizaje profundo eventualmente ideen una forma de contrarrestar los ataques adversarios, tal como finalmente han diseñado una arquitectura robusta a los ángulos y posiciones de ObjectNet. Sin embargo, la falta de confiabilidad subyacente persiste, a la espera de que se descubran más debilidades: cuando las RNA fallan, lo hacen con confianza en lugar de reconocer una entrada como una anomalía.

REQUISITO: Para ser confiables, las herramientas de inteligencia artificial deben tener éxito o reconocer su fracaso, internalizando la comprensión de que la forma (visual u otra) que presentan los datos de entrada es una representación superficial de los procesos y mecanismos subyacentes. Una inteligencia artificial confiable no debe simplemente mapear las entradas con las salidas, sino que debe usar las entradas para formular hipótesis sobre los procesos y mecanismos que las generaron, de modo que pueda analizar correctamente lo observado o generar una excepción al detectar incongruencias o anomalías.

4 Diseño para la Testabilidad y Editabilidad

Por razones pragmáticas [20] y regulatorias [21], la implementación de herramientas de IA opacas está encontrando resistencia, especialmente en aplicaciones con alto riesgo. Esto ha despertado el interés de la comunidad investigadora en la IA explicable (xAI). Resumiendo estudios recientes [12, 13, 19], la xAI se agrupa en dos enfoques principales:

• Las explicaciones locales muestran la parte o partes de la entrada y sus atributos que más contribuyeron a tomar una decisión específica. Técnicas como el enmascaramiento permiten aplicar explicaciones locales a modelos de caja negra.

• Las explicaciones globales se generan típicamente a partir de modelos sustitutos. Estos son modelos con un formalismo intuitivo y de fácil interpretación humana que se entrenan utilizando los resultados del modelo completo.

Las explicaciones locales pueden ser de gran ayuda en el análisis de errores, pero no son capaces de proporcionar tanto el control como la información sobre cómo el modelo percibe el mundo, tal como se plantea en los requisitos anteriores. En cuanto a los modelos sustitutos, como argumenta convincentemente Rudin [24], a menudo son engañosos. A lo que se puede añadir que tampoco es posible transferir parches del sustituto al modelo original.

Sin embargo, existen varios métodos en la literatura reciente que buscan explicar el modelo original. Las RNA construyen un espacio latente donde manipulan vectores de valores. Normalmente, los algoritmos de aprendizaje aplican un sesgo hacia las dimensiones con la menor correlación posible, de modo que todos los vectores de valores sean posibles y ninguna parte del espacio quede sin utilizar. Este sesgo basado en datos proporciona eficiencia, pero crea un espacio donde las dimensiones carecen de significado que pueda comunicarse o explicarse. El blanqueamiento de conceptos [7] es un sesgo de aprendizaje diferente que fuerza las dimensiones del espacio latente a alinearse con los conceptos de interés pre configurados. Un enfoque alternativo aprovecha la retroalimentación descendente para tener en cuenta un contexto explícito. Mientras que ResNet y otras RNA recurrentes similares retroalimentan las salidas de las capas intermedias para proporcionar contexto, la retroalimentación de visión media [18] permite retroalimentar la retroalimentación que no proviene necesariamente de la misma red. Si bien esta posibilidad aún no se ha explorado por completo, en principio permite retroalimentar un contexto construido a partir de conocimiento simbólico categórico.

Estos son nuevos enfoques para un viejo problema en IA: la interconexión de las conceptualizaciones basadas en datos (formas de organizar objetos) que surgen del aprendizaje automático con representaciones de conocimiento simbólico comprensibles y elaboradas por humanos. Contar con una base conceptual compartida, o al menos compatible, es una vía prometedora para explicar cómo la IA segmenta el mundo a medida que procesa las entradas para tomar una decisión. Por ello, el reciente impulso hacia la xAI ha convertido a los enfoques neurosimbólicos en una dirección destacada en este campo [15].

Si bien la IA neurosimbólica puede brindarnos la transparencia y la capacidad de edición que necesitamos, cabe destacar que muchos enfoques imponen a la IA nuestra conceptualización previa, en lugar de que la IA y el ingeniero establezcan una nueva conceptualización compartida. Esto contradice el objetivo de la DFT que planteamos en la Introducción: forzar una conceptualización previa redefine y restringe las características funcionales para facilitar la testabilidad, en lugar de añadir características no funcionales. Esto puede llevar a perder la oportunidad de descubrir en los datos atributos y patrones previamente inadvertidos.

REQUISITO: Los requisitos de fiabilidad mencionados anteriormente deben satisfacerse mejorando los métodos de IA y añadiendo características no funcionales que faciliten la monitorización y el control.

5 Conclusión

Los requisitos propuestos pueden ser ambiciosos, pero los argumentos presentados para respaldarlos indican que son necesarios y alcanzables. Necesarios porque, si bien la fiabilidad no es el único aspecto de la confianza que los sistemas de IA necesitan obtener, es el más difícil de lograr en el ámbito técnico. También es uno de los aspectos, especialmente a través de la monitorización y el control, que permite que los debates no técnicos sobre políticas y rendición de cuentas se basen en la viabilidad técnica.

En cuanto a su grado de realismo, el estado del arte reciente presentado aquí es prometedor. Para empezar, Maynord et al. [18] mencionan la explicabilidad como un posible efecto secundario positivo de la retroalimentación de visión media, aunque sin proporcionar detalles técnicos sobre lo que se prevé. Sin embargo, se puede observar que la retroalimentación de visión media puede integrarse con conceptos del blanqueamiento de conceptos para tener una forma de inspeccionar lo que se representa en las capas intermedias de la red, al menos a nivel de ejemplos característicos. Lo que la retroalimentación de visión media proporciona al blanqueamiento de conceptos es una forma de operar sin la necesidad de supervisar el sistema con muestras características de cada concepto. El blanqueamiento de conceptos, tal como lo formularon originalmente Chen et Al. [7], requiere una supervisión detallada que no escala bien y, lo más importante, restringe los grados de libertad de la red. Por otro lado, en la retroalimentación de visión intermedia, la red tiene la libertad de buscar nuevas formas de segmentar el mundo a medida que estas surgen de los datos, pero no tiene forma de comunicar estos nuevos conceptos ni de construir una conceptualización compartida entre el operador humano y ella misma. Una vía prometedora podría ser que la red organice el mundo, presente esta organización seleccionando o sintetizando muestras de cada concepto y proporcione al operador una forma de rechazar conceptos. El operador tiene en mente una tarea que el sistema intenta lograr y marca los conceptos que deberían usarse como características para las capas posteriores porque están sesgados, son coincidentes o no están justificados. Definir formalmente e implementar realmente lo que significa rechazar un concepto puede ser difícil de generalizar en todas las arquitecturas de red, pero la investigación futura puede implementar esto en arquitecturas individuales y, posteriormente, buscar puntos en común que puedan descartarse.

Esta línea de pensamiento introduce naturalmente en la discusión el concepto de modularización. Dado que los únicos límites explícitos entre los nodos de la red son las capas, cualquier conceptualización como la descrita anteriormente deberá basarse en grupos de vectores de características propagados entre capas. En el plan de investigación descrito anteriormente, no hicimos referencia a cómo las capas posteriores utilizan los conceptos intermedios, y el operador tuvo que excluir conceptos por su potencial uso contrario a su intuición sobre la tarea.

Sería una ventaja obvia poder comunicar cómo se utilizan realmente los conceptos. Sin embargo, cabe destacar que en aplicaciones no triviales esperamos un gran número de conceptos que contribuyan a la siguiente capa sin que necesariamente algunos pesos destaquen de forma prominente. Para poder comunicar de forma significativa cómo interactúan los conceptos de diferentes capas, necesitamos modularizar la red entrenada en fragmentos de fácil comprensión para que el operador pueda inspeccionarlos uno por uno sin tener que retener en la memoria de trabajo las dependencias completas de una capa a la siguiente. Naturalmente, como se argumentó anteriormente, esta modularización idealmente sería posterior al entrenamiento en lugar de impuesta con anterioridad.

A pesar de un avance inminente en los métodos de agrupamiento, esto no será posible en el caso general. Un compromiso razonable puede ser imponer una modularización previa derrotable. Para hacer esto más concreto, supongamos una conceptualización previa, dividida en capas (de abstracción y de la red) e imponiendo exclusividad mutua u otros axiomas entre los conceptos en cada capa. La red tendría que refinar las definiciones de concepto o decidir que una reorganización de los conceptos de una capa mejoraría el resultado general de una manera análoga a cómo la retroalimentación de visión media usa y da forma simultáneamente al contexto representado en capas intermedias. La IA neurosimbólica [25] y la diferenciación automática [3] pueden hacer posible definir y entrenar arquitecturas más complejas y dinámicas, donde los módulos bien definidos interactúan de maneras que están predefinidas pero pueden cambiar ante la evidencia empírica. Estos enfoques asumen una representación lógica (en IA neurosimbólica) o programática (en diferenciación automática) como la columna vertebral estructural de la red; Ambos enfoques proponen métodos para retro propagar las pérdidas a través de toda la red, aprovechando la supervisión habitual de extremo a extremo y evitando la supervisión detallada.

Como la estructura de la red se puede inspeccionar y editar, el operador puede, por ejemplo, eliminar la dependencia entre dos conceptos de capas diferentes en lugar de prohibir completamente el concepto en la capa anterior. Para dar un ejemplo concreto, considere el infame ejemplo de clasificar perros frente a lobos basándose en el fondo verde o nevado en lugar del animal en sí [23]. Prohibir todos los conceptos que caracterizan los fondos no requiere comprender cómo interactúan los conceptos, pero haría que la red fuera específica de la tarea y no susceptible de refinamiento para otras tareas. Prohibir las conexiones entre los conceptos de fondo y los conceptos de animales sería una mejor manera de comunicarse con una red, ya que le otorga un conocimiento del mundo más preciso y, en general, más útil.

Proponemos el escenario del perro frente al lobo, y muchas clasificaciones erróneas famosas similares de la literatura y la tradición sobre visión profunda, como un buen caso de prueba para la investigación en IA neurosimbólica. En concreto, proponemos que el caso de prueba sea que un operador humano sea capaz de corregir una clasificación errónea editando la parte lógica de la red y que un operador experto pueda ver qué editar sin efectos secundarios imprevisibles y catastróficos, de la misma forma que un programador experto puede depurar y corregir un programa con un sufrimiento mínimo de efectos secundarios a larga distancia.

Agradecimientos

Esta investigación fue (co)financiada por la Unión Europea con el número de autorización general 101135782 (proyecto MANOLO). Sin embargo, las opiniones y puntos de vista expresados son exclusivamente de los autores y no reflejan necesariamente los de la Unión Europea ni del CNECT. Ni la Unión Europea ni el CNECT se responsabilizan de ellas.

Referencias

Anurag Arnab, Ondrej Miksik, and Philip H.S. Torr. 2018. On the Robustness of Semantic Segmentation Models to Adversarial Attacks. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2018).