lunes, 15 de abril de 2013

Redes neuronales para series de tiempo


Como lo señalan Swanson y White el año 1995, además de Plasmans y sus colegas el año 1998, un modelo de red neuronal artificial se define como una clase de modelos no lineales flexibles desarrollados por científicos cognitivos. Tales modelos están inspirados en ciertas características asociadas al procesamiento de información en el cerebro humano. El elemento central de este tipo de modelo es la estructura novedosa del sistema de procesamiento de la información, la cual está compuesta por un gran número de elementos interconectados de procesamiento que operan al mismo tiempo para resolver un problema específico. Dichos modelos son capaces de aprender mediante la interacción con su ambiente; tal aprendizaje puede ser entendido como un procedimiento estadístico de estimación recursiva. En particular, una red neuronal artificial se configura para una aplicación específica, de tal forma que el reconocimiento de patrones y la clasificación de información se alcanzan a través de un proceso de aprendizaje. Es de señalar que el aprendizaje tanto en sistemas biológicos como en las redes neuronales artificiales conlleva ajustes en las conexiones sinápticas entre las neuronas.



Las redes neuronales artificiales fueron desarrolladas a partir de los trabajos de investigación sobre la fisiología de las neuronas biológicas de Erlonger y Gasser en el año 1924, y de los estudios sobre la actividad de los neurotransmisores de Hadgkin y Huxley en el año 1956. Una red neuronal artificial emula una red neuronal biológica en la que cada nodo o unidad de procesamiento, se corresponde con una neurona y tiene como función recibir varios impulsos o entradas, procesarlos y transmitir un resultado a otros nodos o salidas. La implementación de las redes neuronales artificiales como modelo matemático para las redes neuronales biológicas fue desarrollada por McCulloch y Pitts en el año 1943. Sin embargo, como entidad matemática, ellas tienen un interés intrínseco y su importancia y aplicación se ha extendido más allá de lo originalmente imaginado. Las redes neuronales artificiales han resultado apropiadas para el análisis de datos generados en una amplia variedad de disciplinas. En este sentido, las redes no sólo han sido empleadas de forma innovativa e imaginativa para analizar grandes y complejas bases de datos, sino que también han sido utilizadas para resolver problemas tradicionalmente ligados al análisis estadístico. La aplicación de las redes neuronales artificiales a la predicción con series de tiempo no es nueva. Existen numerosos trabajos al respecto, siendo probablemente los más conocidos los de Werbos en los años 1974 y 1988, Lapedes el año 1987, Weigend y sus colegas el año 1990, entre otros.

Desde la estadística, Box y Jenkins el año 1976, desarrollaron la metodología de los modelos autorregresivos integrados de promedios móviles, para ajustar una clase de modelos lineales para series de tiempo. Posteriormente, a fines de los años 1990, surgieron versiones robustas de modelos autorregresivos integrados de promedios móviles y de series de tiempo no lineales tendientes a resolver los problemas que introducen la presencia de valores aberrantes o extremos en los datos. En un tiempo más reciente, las redes neuronales sido consideradas como una alternativa para modelar series de tiempo no lineales. Los modelos de redes neuronales se ajustan tradicionalmente por mínimos cuadrados y por lo tanto carecen de robustez en presencia de valores extremos o aberrantes. Como algunos de los procedimientos que tratan con redes neuronales surgen como una generalización natural de los modelos estadísticos lineales “autorregresivos integrados” y “autorregresivos integrados de promedios móviles”, por otra los relacionados con el caso no lineal “no autorregresivos integrados” y “no autorregresivos integrados de promedios móviles”, los procedimientos para ajustar redes neuronales robustas suelen estar relacionados con los procedimientos empleados para modelar series de tiempo robustas.

Una serie temporal o cronológica es una secuencia de datos, observaciones o valores, medidos en determinados momentos del tiempo, ordenados cronológicamente y, normalmente, espaciados entre sí de manera uniforme. El análisis de series temporales comprende métodos que ayudan a interpretar este tipo de datos, extrayendo información representativa, tanto referente a los orígenes o relaciones subyacentes como a la posibilidad de extrapolar y predecir su comportamiento futuro. De hecho uno de los usos más habituales de las series de datos temporales es su análisis para predicción y pronóstico. Por ejemplo de los datos climáticos, de las acciones de bolsa, o las series pluviométricas. Resulta difícil imaginar una rama de las ciencias en la que no aparezcan datos que puedan ser considerados como series temporales. Son estudiadas en estadística, procesamiento de señales, econometría y muchas otras áreas.

El análisis más clásico de las series temporales se basa en la suposición de que los valores que toma la variable de observación es la consecuencia de cuatro componentes, cuya actuación conjunta da como resultado los valores medidos, estos componentes son: (1) La tendencia secular o regular, indica la marcha general y persistente del fenómeno observado, es una componente de la serie que refleja la evolución a largo plazo. Por ejemplo, la tendencia creciente del índice de reciclado de basuras en los países desarrollados, o el uso creciente de Internet en la sociedad, independientemente de que en un mes concreto en un país, por determinadas causas, haya una bajada en el uso de Internet. (2) Variación estacional. Es el movimiento periódico de corto periodo, se trata de una componente causal debida a la influencia de ciertos fenómenos que se repiten de manera periódica en un año, las estaciones, una semana, los fines de semana, o un día, las horas punta, o cualquier otro periodo, recoge las oscilaciones que se producen en esos períodos de repetición. (3) Variación cíclica. Es el componente de la serie que recoge las oscilaciones periódicas de amplitud superior a un año. Movimientos normalmente irregulares alrededor de la tendencia, en las que a diferencia de las variaciones estacionales, tiene un período y amplitud variables, pudiendo clasificarse como cíclicos, cuasicíclicos o recurrentes. (4) Variación aleatoria, accidental, de carácter errático, también denominada residuo, no muestran ninguna regularidad, debidos a fenómenos de carácter ocasional como pueden ser tormentas, terremotos, inundaciones, huelgas, guerras, avances tecnológicos etc.

Las redes neuronales artificiales se reconocen como una de las herramientas matemáticas de uso computacional que mejores resultados está mostrando a la hora de modelar una amplia gama de problemas, esto debido a su gran versatilidad. Y aunque se tiene indicios que, la mayoría de las aplicaciones que se desarrollan con redes neuronales artificiales pueden ser implementadas con métodos estadísticos estándar, estos modelos han mostrado en varias ocasiones que pueden ser superiores a otras técnicas de análisis multivariado. Por ejemplo, han llegado a mejores resultados de predicción que otros métodos clásicos. Esto debido no solo a su capacidad para representar tanto funciones lineales, como funciones no-lineales complejas, habilidad que otros modelos no poseen, sino por su destreza para aprender, re-aprender y generalizar el conocimiento adquirido a nuevas observaciones, siendo un método que puede memorizar. En particular, las redes neuronales artificiales se muestran como una técnica alternativa para modelar series de tiempo, esto debido a que en muchos casos, la evolución de las series presenta características de no ergodicidad, persistencia y no estacionariedad, además de exhibir dependencia a largo plazo. Adicionalmente, estos muestran un fuerte comportamiento no gaussiano y con excesos de retornos no-cero, lo cual conlleva a que algunos de los modelos dinámicos de series de tiempo más populares sean inadecuados en este contexto, como son los modelos tipo “autorregresivo integrado de promedios móviles”. Ya que estos se basan en las condiciones de estacionariedad, dependencia a corto plazo y comportamiento gaussiano de la serie, lo cual va en contraposición con las propiedades estadísticas que estas series muestran, implicando un necesario tratamiento de datos o posibles resultados erróneos.

En los modelos de redes neuronales, las redes tipo “hacia adelante”, son las más empleadas en series de tiempo, dadas sus características de estabilidad y convergencia a la solución “optima”. Y entre estas, las más populares son las redes perceptrón multicapa, las cuales son conocidas por ser “aproximadores universales”. Por otro lado, las redes recurrentes tipo Jordan también han sido empleadas con muy buenos resultados, debido a que pueden responder según las decisiones tomadas en un pasado inmediato, siendo esto coherente con las propiedades de memoria y dependencia a largo plazo en estos objetos de estudio. Dadas las características de flexibilidad y versatilidad de las redes neuronales, surge la necesidad que estas técnicas de inteligencia artificial reflejen las propiedades que presentan estas series de tiempo. Y es precisamente en esta dirección, que se han desarrollado los modelos de redes neuronales dinámicas, las cuales se caracterizan porque están constantemente asimilando cada nuevo dato ya predicho como un nuevo caso de entrenamiento, esto con el propósito de predecir el siguiente dato.

No hay comentarios: