Juan Manuel Torres Moreno
Redes de neuronas artificiales y aprendizaje automático

¿Puede una computadora aprender a resolver problemas sólo a partir de ejemplos? Esta cuestión, abordada no hace mucho tiempo en la ciencia ficción, es actualmente objeto de profundos estudios. Las redes de neuronas artificiales (RNA) son máquinas que poseen esa capacidad de aprendizaje. Esos artefactos han sido propuestos como modelos (extremadamente) simplificados del funcionamiento del cerebro, pues no retienen más que algunas características esenciales: 1) las neuronas no pueden encontrarse más que en dos estados posibles, activas o en reposo; 2) están interconectadas mediante sinapsis que pueden ser modificadas por aprendizaje, y 3) el estado de una neurona a cada instante es determinado por el de otras, información que es transmitida por las sinapsis. Sin embargo, este modelo presenta una riqueza sorprendente de estados y comportamientos que ha sentado las bases de un modelo de memoria y aprendizaje como un fenómeno emergente colectivo: el sistema global presenta propiedades complejas que no pueden predecirse a partir del estudio individual de sus componentes.

En este artículo se pondrá énfasis en una actividad tan trivial para los humanos que pasa desapercibida, pero que presenta dificultades formidables para una máquina: la clasificación de datos.

Aprendizaje y clasificación

La clasificación es la atribución de una clase específica a un objeto. Esta atribución necesita un cierto grado de abstracción para poder extraer generalidades a partir de los ejemplos de los cuales se dispone. Para una máquina, la clasificación de rostros, datos médicos o imágenes son tareas bastante difíciles, en tanto que para un humano son cuestiones cotidianas: ¿quién no es capaz de reconocer el rostro de un amigo que vimos ayer (o aun años después)? Incluso si ahora usa lentes, barba o está peinado de otra manera. Otro ejemplo: en el reconocimiento de caracteres manuscritos, es difícil enunciar una descripción general que tenga en cuenta todas las variaciones particulares de cada caracter. Una técnica que puede ser utilizada para resolver este problema es el aprendizaje. Así, el criterio para decidir si una imagen corresponde a una letra A, B, C... consiste en comparar si es lo suficientemente similar a otras A B o C vistas anteriormente; con ese enfoque, uno no calcula la clasificación de letras, sino que se aprenden a partir de ejemplos.

La capacidad de aprendizaje de las RNA les da una inmensa ventaja sobre métodos tradicionales, ya que tan sólo se requiere disponer de un conjunto de ejemplos (conjunto de aprendizaje) para que la red pueda aprender. Es por ello que las redes de neuronas son ampliamente utilizadas en aplicaciones tan variadas como la previsión, la predicción, la clasificación, el diagnóstico automático, el procesamiento de señales, el reconocimiento de formas, la compresión de datos, la optimización combinatoria, la robótica y la búsqueda de documentos, entre otras.

Las características comunes de las RNA son: una capacidad de autorganización; robustez frente a perturbaciones externas; memoria distribuida, deslocalizada y redundante, y un paralelismo masivo e inherente. A su vez, difieren entre sí por diversos aspectos: sus motivaciones biológicas, su modo de funcionamiento o su campo de aplicaciones. Algunas técnicas neuronales avanzadas son llamadas constructivas, ya que modifican la arquitectura misma de la red en un proceso antagónico de crecimiento-aprendizaje/disminución-olvido.

Desde un punto de vista metodológico, el uso de las RNA no es trivial; sin embargo, cuando las redes son correctamente adaptadas a un problema, permiten desempeños superiores al de otros métodos o incluso al de seres humanos. Todo lo anterior, sin dejar de lado la parte fundamental de la investigación: la comprensión de los mecanismos del intelecto, la cognición y su impacto en la creación de artefactos inteligentes, que es por sí misma un tema por demás excitante.

[email protected]