viernes, 26 de abril de 2013

Sistemas neurodifusos


Durante los últimos treinta a cuarenta años las investigaciones en redes neuronales y en sistemas difusos han sido independientes debido en gran parte a los diferentes orígenes y motivaciones de ambos paradigmas. Hoy es ampliamente conocido que la lógica difusa ofrece un marco muy poderoso para el razonamiento aproximado que intenta modelar el proceso de razonamiento humano en un nivel cognoscitivo. Los sistemas difusos adquieren el conocimiento gracias al dominio del experto el cual es codificado dentro del algoritmo en términos de un conjunto de reglas difusas “si-entonces”. Los sistemas difusos emplean este enfoque basado en reglas e interpolan el razonamiento para responder a entradas nuevas. En contraste, las redes neuronales ofrecen una arquitectura altamente estructurada, con capacidades de aprendizaje y generalización, que intenta imitar el mecanismo neurológico del cerebro. Una red neuronal almacena conocimiento de una manera distribuida dentro de sus pesos, los cuales han sido determinados por medio del entrenamiento, para el aprendizaje, con muestras conocidas. La habilidad de generalización para entradas nuevas está basada en la estructura algebraica inherente de la red neuronal. También se ha demostrado que ambas tecnologías combinadas tienen capacidades elevadas de aproximación universal.


El avance de los sistemas de inteligencia computacional y la búsqueda de soluciones cada vez más completas para los problemas que pueden ser resueltos por estos métodos, han llevado a la unión de técnicas de “computación blanda” haciendo que las debilidades de unos sistemas se compensen con las bondades de otros. Esta última, resulta ser una fuerte motivación para realizar la unión de las técnicas de redes neuronales artificiales y lógica difusa. Recientemente se ha producido un interés considerable en la integración de las redes neuronales y la lógica difusa. Las dos tecnologías pueden ser vistas como complementarias y como consecuencia, el enfoque combinado proporciona un marco de razonamiento aproximado poderoso que tiene capacidades de aprendizaje y generalización. La tecnología combinada también cubre algunas de las desventajas de los enfoques individuales como por ejemplo la transparencia de la red neuronal y la capacidad de aprendizaje limitada de los sistemas difusos.

Dentro de las numerosas metodologías de modelado existentes en las áreas de la estadística y el aprendizaje automático, los sistemas neurodifusos presentan grandes ventajas frente a otras alternativas, al combinar las capacidades aproximativas no lineales de las redes neuronales, junto con las propiedades interpretativas de los modelos difusos. Componen una metodología que proporciona una manera simple de obtener una conclusión a partir de información de entrada imprecisa. El diseño y optimización de estos modelos, en el que los expertos pueden intervenir, resulta en un conjunto de reglas a partir de un repertorio de mediciones disponibles, que facilita el análisis y utilización de dichos modelos para un estudio más claro y en profundidad del fenómeno físico que se está modelando.

Redefiniendo las motivaciones para crear los sistemas híbridos neurodifusos, se pueden mencionar como las más relevantes las siguientes: (1) Los problemas a resolver con estas técnicas inteligentes tienen generalmente una componente de datos empíricos y otra de conocimiento previo, que con los sistemas neurodifusos pueden ser explotados a cabalidad mezclando los métodos cuantitativos y cualitativos de las redes neuronales y la lógica difusa respectivamente. (2) La expresión de conocimiento como una base de reglas lingüísticas, enriquecida o surgida con o a través de datos cuantitativos, es una forma adecuada para hacer realimentación al usuario humano de la forma como el sistema realiza las tareas. (3) Habiendo encontrado que la representación del conocimiento como un sistema difuso se acerca a la forma de razonamiento humano, es natural intentar adicionar a estos sistemas capacidades de aprendizaje, de forma que se emule mejor tal comportamiento o que se mejoren los resultados obtenidos con el uso de solamente el sistema difuso.

En los últimos años se presentaron varios sistemas neurodifusos exitosos reportados por diferentes corrientes de investigación científica. En general estos son sistemas con una estructura fija que interpretan un sistema difuso en términos de una red neuronal tal que cada paso en el proceso es equivalente a por lo menos una capa de la red neuronal. Así, la mayoría de estas arquitecturas tienen al menos una capa correspondiente a la codificación difusa, intersección, implicación y decodificación difusa. Estas arquitecturas difieren de una red neuronal convencional en términos de la uniformidad tanto de los nodos de procesamiento como de la estrategia de la interconexión con el resultado que con frecuencia se requieren algoritmos de entrenamiento modificados. Sin embargo, estas arquitecturas no proporcionan un procedimiento sistemático para determinar el número de reglas del sistema de inferencia difuso. Hay arquitecturas que fijan el número de reglas antes de realizar el entrenamiento de la red mientras que otras fijan los conjuntos difusos de la parte “si” de las reglas, lo que establece un límite para el número de reglas.

Por lo tanto, determinar el número de reglas a utilizar representa un serio problema para los sistemas neurodifusos. Algunos sistemas neurodifusos consideran al número de reglas como un parámetro de diseño más, el cual puede ser determinado utilizando un algoritmo de agrupamiento de datos y los datos de entrada-salida del sistema a modelar. Estas técnicas de agrupamiento proporcionan el planteamiento para encontrar prototipos que caracterizan un conjunto de datos. Estos prototipos son entonces utilizados como reglas difusas en un sistema neurodifuso. Los métodos de agrupamiento desarrollados funcionan bastante bien, sin embargo, procesan los datos fuera de línea por lo que la estructura temporal de los mismos es ignorada, lo que representa un problema cuando se quiere modelar o controlar un sistema en tiempo real. Por lo tanto, resulta interesante desarrollar técnicas de agrupamiento que procesen los datos en línea para modelar sistemas mediante redes neuronales difusas en tiempo real.

Las razones para usar una taxonomía de los sistemas neurodifusos es que muchas de las aproximaciones neurodifusas implementadas hasta hoy, pueden ser enmarcadas dentro de estas divisiones propuestas que se basan en las diferentes combinaciones de las redes neuronales artificiales y los sistemas difusos: (1) Modelos concurrentes. Cuando la red neuronal y el sistema difuso trabajan juntos pero sin interactuar el uno en el otro, es decir, ninguno determina las características del otro. (2) Modelos cooperativos. Cuando la red neuronal se usa para determinar los parámetros de funcionamiento del sistema difuso. En estos modelos, se distinguen dos fases, la de entrenamiento y la de funcionamiento. En la primera, la red neuronal interactúa con el sistema difuso determinando los parámetros del mismo, mientras en la segunda, la red neuronal desaparece dejando sólo el sistema difuso. (3) Modelos híbridos. En esta aproximación, los sistemas difusos y de redes neuronales, trabajan juntos en una arquitectura homogénea que puede ser interpretada como una red neuronal con parámetros difusos o como un sistema difuso con parámetros o funcionamiento distribuidos.

La estructura neurodifusa permite el uso de métodos cualitativos y cuantitativos en la construcción de modelos, en la etapa de aprendizaje, en la de funcionamiento y en la realimentación de conocimiento al usuario, permitiendo así, que todo el conocimiento se encuentre disponible. Los métodos cuantitativos que se observan en el aprendizaje que los sistemas neurodifusos pueden realizarse a partir de datos del ambiente y en su forma matemática de funcionamiento, mientras los métodos cualitativos se reflejan en el sentido lingüístico que tiene la base de conocimiento de los sistemas difusos y que genera una interacción bilateral sistema-ser humano, permitiendo la introducción de conocimiento previo al sistema y la realimentación del estado final del modelo en forma de reglas expresadas lingüísticamente desde el sistema al ser humano. Las otras ventajas, son las conocidas ya ampliamente y que vienen heredadas de los sistemas difusos y de las redes neuronales, tales como interpretación lingüística, introducción de conocimiento previo, auto-aprendizaje, generalización, interpolación, etc.

Sin embargo los sistemas neurodifusos cuentan también con algunas limitaciones: (1) Curso de la dimensionalidad. Los sistemas difusos presentan el problema del crecimiento exponencial del tamaño del modelo respecto al número de variables que poseen, haciendo poco práctico su uso para sistemas de más de cuatro dimensiones. (2) Calidad de los datos. Existen problemas asociados con la cantidad, distribución y ruido en y de los datos. Si los datos están mal distribuidos, el aprendizaje puede no ser muy bueno, presentando especialmente problemas de generalización y de interpolación si faltan muchos datos en cierta región. Este inconveniente es herencia de los sistemas neuronales y puede ser superado interpolando los datos, haciendo un tratamiento previo o buscando una representación adecuada de los mismos. (3) Conocimiento previo. En los sistemas neurodifusos es deseable tener el conocimiento previo y confiable de un experto en el sistema, pues de otro modo, se debe realizar un modelado por "fuerza bruta" exclusivamente a través de los datos numéricos empíricos y existirán problemas al no haber descripción cualitativa del sistema, a menos que se apliquen técnicas de minería de datos a la base de conocimiento del sistema neurodifuso.

No hay comentarios: