Saltar al contenido

5 Conceptos erróneos sobre la IA

En los últimos años me he topado con una serie de conceptos erróneos con respecto a la IA, y a veces, al hablar de la IA con gente de fuera del campo, siento que estamos hablando de dos temas diferentes.

La primera idea falsa tiene que ver con la Inteligencia General Artificial, o AGI:

Los sistemas de IA aplicados son sólo versiones limitadas de AGI

A pesar de lo que muchos piensan, el estado del arte de la IA sigue estando muy por debajo de la inteligencia humana. La Inteligencia General Artificial, es decir, AGI, ha sido el combustible motivador para todos los científicos de la IA desde Turing hasta la actualidad. Algo análogo a la Alquimia, la eterna búsqueda de AGI que replica y excede la inteligencia humana ha resultado en la creación de muchas técnicas y avances científicos. AGI nos ha ayudado a entender las facetas de la inteligencia humana y natural, y como resultado, hemos construido algoritmos efectivos inspirados por nuestra comprensión y modelos de ellos.

Sin embargo, cuando se trata de aplicaciones prácticas no se limitan necesariamente a modelos puros de toma de decisiones humanas, aprendizaje y resolución de problemas. Más bien, en aras de resolver el problema y lograr un desempeño aceptable, los practicantes de AI a menudo hacen lo que sea necesario para construir sistemas prácticos. En el corazón de los avances algorítmicos que resultaron en sistemas de Aprendizaje Profundo, por ejemplo, está una técnica llamada propagación inversa. Esta técnica, sin embargo, no es la forma en que el cerebro construye modelos del mundo. Esto nos lleva a la siguiente idea equivocada:

Existe una solución de IA única para todos los casos.

Una idea errónea común es que la IA puede utilizarse para resolver cualquier problema que surja, es decir, que el estado actual de la IA ha alcanzado un nivel tal que configuraciones menores de “la IA” nos permiten abordar diferentes problemas. Incluso he oído que la gente asume que pasar de un problema a otro hace que el sistema de IA sea más inteligente, como si el mismo sistema de IA estuviera resolviendo ambos problemas al mismo tiempo. La realidad es muy diferente: Los sistemas de IA necesitan ser diseñados, a veces en gran medida, y requieren modelos específicamente entrenados para poder ser aplicados a un problema. Y aunque tareas similares, especialmente aquellas que involucran la detección del mundo (por ejemplo, reconocimiento de voz, procesamiento de imágenes o video) ahora tienen una biblioteca de modelos de referencia disponibles, estos modelos necesitan ser diseñados específicamente para cumplir con los requisitos de implementación y pueden no ser útiles fuera de la caja. Además, los sistemas de IA rara vez son el único componente de las soluciones basadas en IA. A menudo se necesitan muchos componentes programados clásicamente a medida para unirse y aumentar una o más técnicas de IA utilizadas dentro de un sistema. Y sí, hay una multitud de técnicas de IA diferentes por ahí, usadas solas o en soluciones híbridas en conjunto con otras, por lo tanto es incorrecto decir:

AI es lo mismo que Deep Learning

En aquellos tiempos, pensábamos que el término redes neuronales artificiales (RNA) era realmente genial. Hasta que la euforia inicial en torno a su potencial se volvió contraproducente debido a su falta de escalado y aptitud para el sobreajuste. Ahora que esos problemas se han resuelto en su mayor parte, hemos evitado el estigma del viejo nombre al “rebautizar” las redes neurales artificiales como “Aprendizaje Profundo”. El Aprendizaje Profundo o Redes Profundas son RNA a escala, y el “profundo” no se refiere al pensamiento profundo, sino al número de capas ocultas que ahora podemos permitirnos dentro de nuestras RNA (antes era un puñado a lo sumo, y ahora pueden ser cientos).

Deep Learning se utiliza para generar modelos a partir de conjuntos de datos etiquetados. El “aprendizaje” en los métodos de Aprendizaje Profundo se refiere a la generación de los modelos, no a que los modelos sean capaces de aprender en tiempo real a medida que se dispone de nuevos datos. La fase de “aprendizaje” de los modelos de Aprendizaje Profundo ocurre realmente fuera de línea, necesita muchas iteraciones, es intensiva en tiempo y proceso, y es difícil de paralelizar.

Sin embargo, en su mayor parte, los sistemas de Aprendizaje Profundo son alimentados por grandes conjuntos de datos, por lo que la perspectiva de que se generen modelos nuevos y útiles a partir de grandes y únicos conjuntos de datos ha alimentado la idea errónea de que…

Todo se trata de GRANDES datos

No lo es. En realidad se trata de buenos datos. Los conjuntos de datos grandes y desequilibrados pueden ser engañosos, especialmente si sólo capturan parcialmente los datos más relevantes para el dominio. Además, en muchos dominios, los datos históricos pueden volverse irrelevantes rápidamente. En el comercio de alta frecuencia en la Bolsa de Valores de Nueva York, por ejemplo, los datos recientes son mucho más pertinentes y valiosos que, por ejemplo, los datos anteriores a 2001, cuando todavía no habían adoptado la decimalización.

Finalmente, un malentendido general con el que me topo muy a menudo:

Si un sistema resuelve un problema que creemos que requiere inteligencia, eso significa que está usando IA
Este es un poco filosófico en su naturaleza, y depende de su definición de inteligencia. De hecho, la definición de Turing no lo refutaría. Sin embargo, en lo que se refiere a la IA convencional, no se considera un sistema de IA un sistema completamente diseñado, por ejemplo, para permitir la conducción autónoma de coches, que no utiliza ninguna técnica de IA. Si el comportamiento del sistema no es el resultado del comportamiento emergente de las técnicas de IA utilizadas bajo el capó, si los programadores escriben el código de principio a fin, de una manera determinista y diseñada, entonces el sistema no se considera un sistema basado en IA, incluso si así lo parece.

La IA allana el camino para un futuro mejor

A pesar de los conceptos erróneos comunes en torno a la IA, la única suposición correcta es que la IA está aquí para quedarse y es, de hecho, la ventana hacia el futuro. La IA todavía tiene un largo camino por recorrer antes de que pueda ser utilizada para resolver todos los problemas existentes y para ser industrializada para su uso a gran escala. Los modelos de Aprendizaje Profundo, por ejemplo, requieren muchas horas de doctorado de expertos para diseñarse de manera efectiva, a menudo requiriendo ajustes de parámetros de ingeniería elaborada y opciones arquitectónicas dependiendo del caso de uso. Actualmente, los científicos de la IA están trabajando arduamente para simplificar esta tarea e incluso están utilizando otras técnicas de IA como el aprendizaje de refuerzo y la búsqueda de una arquitectura basada en la población o evolutiva para reducir este esfuerzo. El siguiente gran paso para la IA es hacerla creativa y adaptable, mientras que al mismo tiempo, lo suficientemente poderosa como para exceder la capacidad humana para construir modelos.