Por: Carlos A. FERREYROS SOTO
Doctor en Derecho
Universidad de Montpellier I Francia.
Resumen
El 20 de setiembre de 2022, la Agencia Española de Protección de Datos y el Supervisor Europeo de Datos Personales publicaron un documento en el cual identifican 10 Malentendidos, entre los más frecuentes, contrastádolos con un argumento denominado Realidad. Ambos se relacionan con el Aprendizaje Automático (Machine Learning o ML), aquella rama específica de la Inteligencia Artificial, IA, aplicada a la resolución de problemas específicos y limitados, como tareas de clasificación o predicción. A diferencia de otros tipos de IA que intentan emular la experiencia humana (por ejemplo, sistemas expertos ); el comportamiento de los sistemas de aprendizaje automático no está definido por un conjunto predeterminado de instrucciones.
Los modelos de ML se entrenan utilizando conjuntos de datos. Durante su
entrenamiento, los sistemas de ML se adaptan de forma autónoma a los patrones
encontrados en las diferentes variables de un conjunto de datos dado, creando
correlaciones. Una vez entrenado, el sistema utilizará los patrones aprendidos
para generar un resultado.
A diferencia de otros tipos de sistemas de IA , el rendimiento de los
modelos de ML depende en gran medida de la precisión y la representatividad de
los datos utilizados para su entrenamiento (datos de entrenamiento).
El objetivo de este ejercicio es dilucidar los conceptos erróneos comunes
que rodean a los sistemas de ML, al mismo tiempo que subrayan la importancia de
implementar estas tecnologías acorde con los valores de la UE, los principios
de protección de datos y el total respeto a las personas.
El texto íntegro de este documento puede ser consultado en el enlace
siguiente:
Si desea mayor información sobre estos temas, consúltenos al correo electrónico: cferreyros@hotmail.com
______________________________________________________________
MALENTENDIDOS VERSUS REALIDAD
Malentendido 1. Correlación implica causalidad.
Realidad: Causalidad es más que solo
establecer correlaciones.
Malentendido 2. Al desarrollar sistemas de aprendizaje automático,
cuanto más datos y mayor sea la variedad, es mejor.
Realidad: Los conjuntos de datos de
entrenamiento de ML deben seleccionarse para cumplir umbrales de precisión y
representatividad.
Malentendido 3. ML necesita datos de entrenamiento
completamente libres de errores.
Realidad: Para conseguir un buen rendimiento
los modelos de ML se necesitan datos de entrenamiento con tan solo una calidad
superior a un cierto umbral.
Malentendido 4. El desarrollo de sistemas de ML
requiere grandes repositorios de datos o el intercambio de conjuntos de datos
de diferentes fuentes.
Realidad: El aprendizaje federado permite el
desarrollo de sistemas de aprendizaje automático sin compartir datos de
entrenamiento.
Malentendido 5.Los modelos de ML mejoran automáticamente con el tiempo.
Realidad: Una vez implementados, el
rendimiento de los modelos de ML puede deteriorarse y no mejorará a menos que
reciba entrenamiento adicional.
Malentendido 6. Las decisiones automáticas tomadas
por los algoritmos de ML no pueden ser explicadas.
Realidad: Un modelo de ML bien diseñado
puede producir decisiones comprensibles para todas las partes interesadas
relevantes.
Malentendido 7. La transparencia en ML viola la
propiedad intelectual y no es entendida por el usuario.
Realidad: Es posible proporcionar una
transparencia significativa a los usuarios de IA sin dañar la propiedad
intelectual.
Malentendido 8 . Los sistemas de ML están sujetos a
menos sesgos que los propios humanos.
Realidad: Los sistemas de ML están sujetos a
diferentes tipos de sesgos y algunos de estos provienen de sesgos humanos
Malentendido 9. ML puede predecir con precisión el
futuro.
Realidad: Las predicciones de un sistema ML
solo son precisas cuando los eventos futuros reproducen tendencias pasadas.
Malentendido 10. Los interesados son capaces de
anticipar las posibles salidas que los sistemas de ML pueden dar con sus datos.
Realidad: La capacidad de ML para encontrar
correlaciones no evidentes en los datos puede terminar por revelar información
personal adicional, sin que el interesado sea consciente de ello.
No hay comentarios:
Publicar un comentario