banner
terminos-cientificos-decidata

Big Data, IA… Lenguaje Científico y Responsabilidad

En los últimos tiempos es habitual toparse en el día a día con términos como “algoritmo”, “modelo” o “Big Data”. Los encontramos en la prensa escrita, en los telediarios y en los foros científicos, pero también los oímos en conversaciones propias o ajenas, en el metro, en el gimnasio o en la cola de la carnicería. Forman parte de un “runrun” que acapara las pausas para el café y las cenas entre amigos.

La presencia de estos conceptos en el lenguaje cotidiano atestigua el grado de penetración que tiene a día de hoy la inteligencia artificial en la cultura popular. El ascenso meteórico de esta tecnología ha dado
lugar a nuevos significantes que forman ya parte del imaginario colectivo. Desde las máquinas, a los programas, las decisiones automatizadas o las métricas, vivimos rodeados de un mar de nuevos palabros que se hace a veces difícil de navegar.

El uso de estos términos exaspera, cuando no indigna, a los expertos, que critican la falta de rigor terminológico. Somos estos mismos expertos, sin embargo, los que a menudo contribuimos activamente a la confusión haciendo una utilización abusiva y en ocasiones interesada del lenguaje. Yo misma me he permitido el lujo en este par de párrafos de utilizar términos notablemente complejos a mi mayor conveniencia, hablando de “tecnología” o de “inteligencia artificial” para captar la atención del lector.

Es este un problema no menor. En la medida en que diverjan significados y significantes, nos distanciaremos de un debate riguroso sobre el uso del aprendizaje automático, que se antoja hoy más necesario que nunca.

Cuidar el uso de términos como “Big Data” a la ligera

La semana pasada asistí a un seminario de investigación en el que estudiantes de primer año de doctorado presentaban sus avances a sus colegas más seniors. Uno de ellos nos habló, bajo la atenta mirada de sus dos supervisores, de los resultados de un estudio de campo orientado a entender los motivos que llevan a los consumidores a confiar en las recomendaciones basadas en modelos de aprendizaje automático en unas ocasiones si y en otras no. Sus resultados estaban basados en un análisis de tipo cuantitativo sobre una encuesta realizada a un conjunto de individuos a través de una herramienta online. La encuesta indagaba acerca de las características y los contextos deseables para diseñar un modelo de recomendación automatizado que fuera aceptado por los usuarios. Lo hacía a través de preguntas del tipo “confiaría usted en las recomendaciones de un algoritmo para comprar un producto de limpieza?”, “a través de qué canal debería el sistema de inteligencia artificial hacerle llegar sus recomendaciones?”, o “consideraría aceptable que un algoritmo tasara su vivienda?”.


El ejemplo en mi opinión es relevante, por haberse dado en un entorno en teoría informado y por referirse a un trabajo de investigación enfocado a comprender mejor la percepción social de los productos derivados del aprendizaje automático. Más que relevante, es preocupante. Hablar de sistemas de inteligencia artificial en este contexto es inexacto. Hablar de algoritmos que recomiendan productos no es solo inexacto, es directamente absurdo. Los algoritmos guían el aprendizaje de los modelos que, una vez entrenados, son los que proporcionan las predicciones. Las recomendaciones en este caso. El usuario de a pie rara vez interactúa con un algoritmo. Y qué decir con un sistema de inteligencia artificial.


Un ejemplo que se usa habitualmente para explicar lo que es un algoritmo es de las recetas de cocina. Un algoritmo es un conjunto de reglas que si seguimos a rajatabla nos llevan a obtener un resultado. En este caso, un plato determinado. Supongamos que lo que queremos es hacer una tortilla de patatas. Hay muchas recetas posibles para hacer una tortilla. Algunos dirán que las patatas hay que freírlas a fuego alto primero y luego dejarlas cocer. Otros que es mejor hacerlas a fuego lento durante un tiempo largo. Habrá quien eche la sal directamente sobre las patatas y quien lo haga sobre el huevo batido. De igual forma, existen diversos algoritmos posibles para entrenar un mismo modelo.


Los datos que se utilizan para entrenar un modelo determinado pueden servir también para entrenar otros. Con tres o cuatro huevos, un par de patatas y una pizca de sal, podemos hacer una tortilla de patatas. Pero también unos huevos rotos. O una tortilla francesa con patatas fritas. Por último, pueden existir versiones distintas del modelo. Habrá quien diga, con razón, que una tortilla de patatas debe llevar cebolla. O quien prefiera incluir pimientos.


Sea como fuere, lo importante en relación con el ejemplo anterior es entender que los clientes de un restaurante se comerán con gusto la tortilla, pero difícilmente harán lo mismo con la receta. Llegados a este punto, quiero aclarar que no pretendo con este ejemplo señalar al estudiante. Ni tampoco a sus supervisores. Al contrario, creo que son todos ellos víctimas del lenguaje. Ese lenguaje que nos hemos dado entre todos, a base de utilizar a la ligera, términos como “Big data” para referirnos al entrenamiento de modelos de machine learning, o “Inteligencia Artificial” para hablar de regresiones lineales.

Capacitación digital ciudadana

La hipérbole, dirán algunos, quizás sea molesta, pero no hace daño a nadie. Tal vez sea cierto eso. Pero no lo es menos que aporta ruido. Ruido sobre un tema ante el cual la mayor parte de la ciudadanía se siente indefensa. Indefensa por no saber y por carecer de las herramientas para poder entender. Es una sensación nada agradable, la de la indefensión. Le hace sentir a una incompetente, incapaz, insegura.


La capacitación digital de la ciudadanía pasa por políticas públicas que inviertan en la cualificación y la re-cualificación tecnológica de las personas. Esta es una responsabilidad de los estados y de sus dirigentes. La nuestra es contribuir a una narrativa rigurosa y no caer en la palabra fácil o la aproximación simplona.
El lenguaje importa. Hacer un uso adecuado de él es un acto de responsabilidad colectiva.

Si te ha gustado el artículo, puedes visitar nuestro blog para leer más como éste y pasarte por nuestra web si te interesa la Analítica de Datos y el Machine Learning.