jueves, 13 de junio de 2013

UNA TEORIA UNIFICADA DE LA COGNICION (SOAR).


Para Allen Newell, la mente es el sistema de control que guia al organismo conductual en sus complejas interacciones con el mundo real dinámico. Ese sistema de control se podria presentar con la nomenclatura habitual de Wiener. Pero Newell prefiere señalar que ese control consiste en disponer de conocimiento (inputs sensoriales y experiencia simbólica en la memoria de largo alcance) y actuar en consecuencia (output motor y nueva marca simbólica en la memoria) (p 45). Su General Problem Solver (obra tambien de Herbert Simon) aporta una vision segun la cual el estimulo para la actividad cerebral es la diferencia entre la señal de la situación en el mundo percibido y la señal esperable o deseable (para satisfacer un estado meta) por las estructuras anidadas en la memoria. De ese filtro del cual se computa la diferencia de señal, se genera, como resultante, la señal de alarma o de problema, que motiva a los mecanismos ejecutivos que dan origen a la respuesta muscular, incluida el habla. Aqui aparece la biotermodinámica, ya que cada agente perteneciente a los mecanismos ejecutivos, debe actuar de tal manera que se disminuya la diferencia resultante que lo alertó (principio de Le Chatelier). (Minsky M - 7.8).


Una teoria explicativa de un sistema tan complejo como la mente no ofrece garantia para su credibilidad, salvo que se la pueda concretar, usandola como sustento de un sistema operativo del cerebro, con herramientas de la inteligencia artificial. Observando entonces las limitaciones de la teoria, se la puede creer tentativamente o corregir. Esto exige mucha paciencia a esta altura de los estudios. Una de las posibilidades es la de usar el sistema SOAR (State, Operator And Result) de Allen Newell, mas frecuentemente llamado Soar, una mejora a lo largo de decadas del GPS (General Problem Solver) de Newell y Herbert Simon.

En este sistema, la hipotesis es que el cerebro actua como un instrumento de control que trata de preservar la supervivencia frente a un ambiente externo poco amigable y una arquitectura interna poco agil ante episodios que provocan heridas en esa misma arquitectura. Un esquema simplificado que ignora detalles es el de la Fig 10.

Se puede visualizar la Fig 10 de esta manera. Sean dos tableros electricos llenos de lamparas, enfrentados entre si. Uno para los estimulos y otro para las respuestas. El tablero de entradas monitorea al mundo externo y cada tanto se encienden algunas lamparas y se apagan otras, lo cual no abarca la totalidad del mundo externo, sino una fracción, el mundo perceptual de von Uexküll. El tablero de salida hace actuar (mover o hablar) segun como las lamparas del mismo se enciendan y apaguen. No abarca la totalidad de lo que el cerebro quisiera, sino con las limitaciones de estado atlético y de lenguaje disponible en la punta de la lengua. El problema para la ciencia es que sucede entre estos dos tableros, con sus cableados, filtros, pautas, emociones, pensamientos, sensaciones de bienestar conciente, escalas de valores humanos y religiosos, etc. La

41,

                                                                     .

                    (2) CEREBRO CON SUS REDES NEURALES
                Subsistema de reconocimiento (filtros) y de
                gestion de situaciones de alarma o problema
               /                                           \
             (1)                                          (3)
          ESTIMULO                                     RESPUESTA
          Subsistema                                   Subsistema
          de Percepción                                de Acción
          sensorial                                    motriz
          (sensores)                                   (musculos)
             | | |                                       | | |
            ----------Mundo perceptual de JJ von Uexküll------
Fig 10- La mente aparece configurada como estimulable por contingencias del mundo perceptual, detectadas por los sensores, las que afectan la supervivencia del individuo y que necesitan de una acción motora para su superación (huida, enfrentamiento, etc.). Esto se extiende a casos donde no se sabe que hacer a continuación (problemas). El suprasistema cognitivo total, transforma señales subsimbólicas de riesgos presentes en el mundo perceptual externo, captadas en paralelo por los sentidos fisiologicos, en señales subsimbólicas de respuesta ante el riesgo. La "causa" por la cual el cerebro procesa una alarma es asimismo un producto del cerebro. Como resultado, se aprecia que este organo transduce autoorganizadamente el sensorium en motorium.

conciencia monitora, que ya se introdujo antes, con nuevos aportes cuyo inventario no se sabe bien cuál es, se ha enseñoreado del espacio entre tableros.

La visión simplificada de la Fig 10 es coherente con el modelo especulativo de Daniel Schacter, que llama al estímulo, al cerebro y a la respuesta, respectivamente:

(1)"Módulos especializados para el conocimiento";
(2a)"Sistema de conciencia fenoménica", que aloja sensaciones y experiencias y
(2b)"Sistema ejecutivo central", con funciones de procesamiento de la información; y
(3) "Sistema de respuesta"
Están fuertemente regulados por el cerebro, los sentidos fisiológicos, como el oído y los ojos, donde más de la mitad de las conexiones vuelven del cerebro al oído y más del 10% de ellas van del cerebro a la vista. Están tambien fuertemente reguladas las salidas, ya que a medida que surge una dinámica muscular como respuesta, esa respuesta es analizada de vuelta por los sentidos para el eventual reajuste de toda la tarea. Con todos estos matices hay así un algoritmo entre el tablero de entrada y el de salida, con dos productos principales: modificar las luces del tablero de salida y modificar el estado interno, la experiencia, la conciencia del espacio entre tableros. Cuando Juanita, de cuatro años, empieza a aprender a hamacarse, coordinando músculos y escuchando los aplausos y voces de aliento de sus progenitores, tiene una experiencia suya personal e incomunicable, que no aparece "en el tablero de salida", ni se pierde totalmente como entropía, ya que deja marca.

Para Allen Newell, la mente es el sistema de control que guia al organismo conductual en sus complejas interacciones con el mundo real dinámico. Ese sistema de control se podria presentar con la nomenclatura habitual de Wiener. Pero Newell prefiere señalar que ese control consiste en disponer de conocimiento (inputs sensoriales y experiencia simbólica en la memoria de largo alcance) y actuar en consecuencia (output motor y nueva marca simbólica en la memoria) (p 45). Su General Problem Solver (obra tambien de Herbert Simon) aporta una vision segun la cual el estimulo para la actividad cerebral es la diferencia entre la señal de la situación en el mundo percibido y la señal esperable o deseable (para satisfacer un estado meta) por las estructuras anidadas en la memoria. De ese filtro del cual se computa la diferencia de señal, se genera, como resultante, la señal de alarma o de problema, que motiva a los mecanismos ejecutivos que dan origen a la respuesta muscular, incluida el habla. Aqui aparece un corolario biotermodinámico, ya que cada agente alertado perteneciente a los mecanismos ejecutivos, debe actuar de tal manera que se disminuya la diferencia resultante que lo alerto (principio de Le Chatelier). (Minsky M - 7.8).

Este es el modelo de Wiener-Newell para el control de alarmas. Allen Newell (p.42) interpreta que el comparador generador de alarma de la Fig 11 es basico del control ejercido por el cerebro. Este organo procesa los inputs

42.


                                           ESTIMULO
                                           Sensores
                                   Señal del mundo percibido
                                                |
señal de                               dinámica del proceso
conducta     comparador   operadores   de aplicar operadores        RESPUESTA
para super-  generador--->para la----> para transformar la-----O->   Acción
vivencia,    de señal     lógica de    señal de alarma en      |
anidada en   de alarma    control      señal de conducta       |
memoria         ^                                              |
                |                                              |
                 ---señal de conducta en función del tiempo----
Fig 11 - Diagrama tentativo de control de Wiener-Newell. El objetivo es el de encontrar diferencias en la conducta asociada con señales del mundo perceptual y la conducta actualmente generada. Esa diferencia es la resultante de comparación de la señal de conducta previa con la señal esperada para la supervivencia o del no-saber-que-hacer. Una vez lograda la señal de alarma, la lógica de control le aplica operadores conducta/alarma ya sea por defecto o por una mezcla entre deliberación y preparación. Con esos operadores el ser humano ingresa en una dinámica de progresivo reemplazo de la señal del mundo percibido por una señal de nueva conducta, que se amplifica o decae. En el texto se explica una realimentación (no anotada aqui) por la cual las señales del mundo percibido dejan de ser neutras para ser alarmantes, lo cual se logra por las vias bidireccionales cerebro-ojo y cerebro-oido. Las lógicas de control y las dinámicas de proceso relacionadas con el uso de operadores y con la formación de espacios de gestion de alarmas (o espacios de gestion de problemas) han sido ensayadas por la evolución a traves de muchos milenios y solamente han sobrevivido las arquitecturas con neto valor de supervivencia.

sensoriales del mundo percibido inicialmente neutros y contrastando esos inputs con lo esperado (riesgo) procesa la diferencia hasta que se construye una señal de conducta proporcional al riesgo en cada momento sucesivo, corregida por un analisis de los movimientos que se estan ejecutando, movimientos que ahora son parte del mundo percibido.

Con estos detalles, la Fig 10 adquiere el aspecto de la Fig 11, un diagrama de control que aqui se denomina de Wiener-Newell. Las nuevas palabras clave son sensores de estimulos externos (tanto energias como moleculas ambientales), respuesta, en este caso señal de conducta o de acción motora (muscular), valor de consigna o mandato de supervivencia, lógica de control (Sistema Operativo para reconocimiento del riesgo, implementación de la tarea, busqueda de soluciones) y dinámica de proceso resultante de gestionar el "state, operator and result" (Soar). Segun este esquema existe una dinámica de proceso propia de un humano carente de sistema operativo pero con acción motora, sobre la cual actua el sistema operativo con su implicita lógica de control. La referida dinámica de proceso ha debido coevolucionar con la lógica de control para formar un machimbre adecuado entre una y otra. Se ha estimado que la adecuación de la señal ingresante del mundo externo (ya concentrada para cubrir la situación de riesgo) a la señal emergente de conducta a satisfacer, gatilla un aprendizaje cada dos segundos, en promedio. El resultado es (1) la acción motriz y (2) la nueva marca resultante del aprendizaje, que retroalimenta al "módulo" de la lógica de control, relación no mostrada por la Fig 11.


                         MEMORIA DE LARGO ALCANCE

C, PRODUCCIONES               K, PRODUCCIONES               D, PRODUCCIONES
RESULTANTES DE                COGNITIVAS                    RESULTANTES DE
CODIFICACION DE SEÑALES       (COGNICION CENTRAL)           DESCODIFICACION
SUBSIMBOLICAS


    E (descodificado)                                     A (descodificado)


                              MEMORIA RAPIDA

   E1,E2,...     LISTADO DE OBJETIVOS ASOCIADOS CON ALARMAS
                              Y CON IMPASSES.

P-sistemas perceptuales                                  M-sistemas motores
---------------SENTIDOS ---------------------------------MUSCULOS-----

                      MUNDO PERCEPTUAL, AHORA POCO AMIGABLE

Fig 12 - Mecanismos de Soar en el caso de alarmas no satisfechas espontaneamente. Cada vez que se atraviesa el limite entre memoria rapida y memoria de largo alcance, Soar ejecuta un "Gran Salto de Newell", explicado en el texto. La actividad cerebral y el sistema Soar utilizan señales simbólicas para sus procesos principales en la memoria de largo alcance. La memoria de largo alcance recibe como estimulos para sus procesos sugerencias subsimbólicas E provenientes de la memoria rápida. Codifica esos elementos y con fragmentos simbólicos de esos elementos o con similitudes simbólicas de ellos evoca condiciones simbólicas C, de cuya gestión o producción resultan acciones simbólicas A que se descodifican como subsimbólicas y se trasladan a la memoria rápida para sufrir el procesamiento típico del espacio de alarmas o de problema (Fig 15). La hilera de objetivos solamente se halla en la memoria rápida. En la memoria lenta, mediante K, se buscan asociaciones entre los fragmentos de los elementos de la memoria rápida y las acciones que alguna vez se tomaron con casos parecidos. Desde ese punto de vista es una memoria de reconocimiento de las pistas evocadas por la percepción, en tanto y en cuanto coincidan con otras pistas experimentadas y registradas de eventos anteriores.

La diferencia detectada por el comparador de la Fig 11 es la alarma a gestionar o el problema a resolver. Todo el mecanismo de la Fig 11 es el de la "gestión de una alarma" o de "resolución de un problema". Tiene menos valor en el caso de un juego (donde sin embargo se aprenden los límites para una respuesta frente a un riesgo), de un vagabundeo, una lectura, la conversación, la curiosidad, la dactilografía de transcripción, etc., donde no es tan fácil asociar dichos estados con alarmas o aún problemas. En general, las funciones de control son parecidas y el esquema, cambiando lo que hay que cambiar, sigue en vigencia. Si bien las alarmas son las fuerzas impulsoras ancestralmente prioritarias para la operación mental, acondicionada para la gestion de dichas alarmas, los mismos circuítos decisionales (por ejemplo, de deliberación versus preparacion) aparecen en casos más normales. El soporte físico de la evolución del cerebro, con amplia disponibilidad para nuevos aportes, sumado al soporte lógico de marcas dejadas por otras habilidades normales, se complementan en el proceso de búsqueda de mejores estrategias frente a alarmas.

Sea la Fig 12 donde el módulo (2), Cerebro, de la Fig 10, se subdivide en

44.

dos modulos según dos tipos de memoria ya considerados previamente. Ese reducido número simplifica la presentación del tema. Abarca la memoria de largo alcance o lenta (arriba en el esquema) y la memoria rápida o de trabajo (abajo), soportes físicos para reservorio de hábitos de gestión de alarmas y problemas tanto innatos como aprendidos, de aromas, gustos, texturas, imágenes y sonidos, de humores, sentimientos y pensamientos conocidos previamente.

Soar se restringe a la tarea intelectual, subconjunto de un panorama más amplio. En la memoria rápida se halla el listado de objetivos lejanamente asociados con alarmas, problemas y seudo-problemas y cercanamente asociados con esos fenómenos de aprendizaje, ya indicados, que ocurren cada dos segundos en promedio, o sea las impasses de Newell,APENDICE 9. Esto último implica objetivos y subobjetivos que van cambiando a medida que avanza la dinámica del proceso, esquematizada en Fig 11. Es en la memoria rápida donde se pueden originar los mandatos, previamente descriptos, para concentrar, afinar y enderezar los sentidos fisiológicos de tal manera de satisfacer mejor su tarea de detección. Esto ocurre en paralelo con la transición entre diferentes estados, cada uno de los cuales arrastra consigo algun espacio de alarma o de problema. Mientras la memoria rapida maneja señales subsimbólicas, la memoria de largo alcance las codifica en señales simbólicas (todo símbolo es una metáfora de algo real y un subsímbolo es una metáfora de algo simbólico) que deben descodificarse para su aporte a la memoria rápida en plena dinámica estimulada por los sentidos y por la lógica de control para dar como respuesta señales adecuadas sobre los musculos. La memoria rápida es afectada accidentalmente por déficits (Crick, The Astonishing Hypothesis, p.174) y el paciente olvida lo sucedido inmediatamente antes del accidente. No todos los autores aceptan que estos argumentos impliquen la existencia real de una memoria rápida, creyendo más bien en retardos de codificación (Glenberg, 4.3).

Se describen dos lenguajes. Supóngase un espacio de problema con una canilla de agua, un sumidero y dos baldes, uno grande con capacidad de 4 litros y otro chico con capacidad de 3 litros. El estado inicial es el de ambos baldes vacíos, con existencia de canillas y sumideros. El estado meta para el agente es el de lograr ubicar 2 litros de agua en el grande y tener vacio el chico, para lo cual puede llenar estos baldes al ras, vaciarlos del todo o transferir agua de uno a otro. Esto implica seis operadores diferentes. Arbitrariamente, éste es uno de los dos lenguajes: sea el subsimbólico. El Gran Salto de Newell sucede a continuación. El lenguaje simbólico debe ser distinto. Como metáfora de este lenguaje distinto se usara uno basado en nacimientos y muertes en dos familias, de apellidos Grandi y Chiqui, respectivamente. Existe un hospital para los nacimientos y muertes.

Sea el caso en lenguaje subsimbólico. Una tentativa es llenar el balde grande con agua de canilla. Se observa una transición de fase para el balde grande, de vacío a lleno al ras y 4 litros finales.

Sea el mismo caso en lenguaje simbólico. Supóngase que el lenguaje de la mente tenga todas las pistas de sus experiencias previas en términos de nacimientos, muertes e inventarios de familias. No entiende señales de operaciones en baldes, ni guarda experiencia alguna en dichos términos. O no hace nada con los baldes, o construye una simulación usando nacimientos, muertes y el hospital. Entonces, llenar el balde grande equivale para el agente que la familia Grandi, sin miembros en condiciones iniciales, tiene 4 nacimientos en el hospital. Con las pistas preexistentes sobre inventarios similares, el lenguaje simbólico se abstrae en una transición de fase desde (0 0 1) hacia (4 0 1), donde cada columna de los vectores

45.



---------------------------------------------------------------------------
LENGUAJE CODIFICADO

"En el hospital pueden morir y nacer miembros de las familias
Grandi y Chiqui."

Familia Grandi
   Inventario nulo   -->  Nacen 4 Mueren 0 -->      Inventario 4

Familia Chiqui
   Inventario nulo   -->  Nacen 0 Mueren 0 -->      Inventario nulo

(Codificación)             (Codificación)           (Descodificación)


LENGUAJE DESCODIFICADO

"Con canilla de agua y sumidero, pueden llenarse y vaciarse, también
transferirse entre si, un balde grande y otro chico."

Balde grande vacio-->Poner balde bajo canilla abierta-->Balde grande lleno
     X                          T                            X(T)
                               | 1 0 0 |
  (0 0 1)         x            | 0 1 0 |        =            (4 0 1)
                               | 4 0 1 |
---------------------------------------------------------------------------


Fig 13 - Mundo interno de la memoria de largo alcance (arriba) en lenguaje codificado simbólico o metafórico y mundo externo más cercano a los sentidos y a la memoria de trabajo (abajo), en lenguaje descodificado y subsimbólico, como dos representaciones complementarias del mundo de los dos baldes. La mano moviendo el balde y abriendo la canilla - gestos representados por T - actúa como un operador de transformación del estado inicial en un estado nuevo. Estas relaciones de codificación y descodificación se abstraen adoptando la forma de una LEY DE REPRESENTACION. X es un vector fila premultiplicador. T es una matriz postmultiplicadora y X(T) es el vector fila resultante de aplicar (o sea multiplicar matricialmente) X por T. El Gran Salto consiste en que la gestión, en lugar de ocurrir trivialmente, pasa en su mecanismo por una operación interna de codificación y descodificación de señales. "->" significa pasaje de tiempo.
--------------------------------------------------------------------------

fila tiene significado físico. La primera columna es el inventario de los Grandi, la segunda columna lo es de los Chiqui y la tercera indica la existencia de un ámbito para nacer y morir. En ese ámbito han nacido cuatro miembros de la familia Grandi (Fig 13).

Como ambos son vectores filas, el operador que transforma un vector inicial en otro de salida, tendra, según pistas preexistentes, el aspecto de la siguiente matriz cuadrada


                                | 1 0 0 |
                               | 0 1 0 |
                               | 4 0 1 |
donde cada uno de los elementos de la matriz tiene significado físico. Si multiplicamos el vector fila de entradas por esa matriz, obtenemos el vector fila de salidas. Si por las insuficientes pistas preexistentes se construye una matriz con otro aspecto, se produce una impasse porque el inventario no cierra. ¿Cómo se gestiona esta impasse? Se solicita un nuevo espacio de problema, para mejorar la matriz mal hecha. Se establece una submeta, la de resolver la inconsistencia. Equivale a proponer otro operador. Cuando se obtiene el resultado correcto, se ha aprendido. Queda

46.

la forma de la matriz como pista para otras situaciones de inventarios en crecimiento numérico, aplicables a contenidos de billeteras, trajes de armarios o litros de combustible en el tanque del automóvil.

Durante la gestion continuamente se reciben y se devuelven las matrices tentativas generadas. El flujo va entre la memoria de largo alcance y la memoria rápida para su gestión. Cuando finalmente el resultado es verificable, habrá que descodificar los números para que la agencia pueda hacer algo en términos de movimientos con algun balde.

Descodificando esto, en el lenguaje subsimbólico, implica llenar el balde grande y observar que no se ha logrado el estado meta, (2 0 1), Fig 13.

La teoría unificada de la cognición Soar, esquematizada en la Fig 13, se formaliza asi:


        X(T) = DESCODIFICAR {CODIFICAR(X)[CODIFICAR(T)]}

ley de representación donde T es la transformación "muscular" externa, X es la situación original externa y X(T) es la situación final con intervención "muscular". X(T) no se obtiene trivialmente cuando intervienen los dos niveles de memoria. Termodinamicamente es cuesta arriba.
UNA DISGRESION EPISTEMOLOGICA
M. Minsky (1.5) explica que cada paso de una secuencia de este tipo es harto complicada la primera vez que se ejecuta, pero con la práctica la tarea pasa a ser de "sentido común".

La trascendencia de la ley de representación se introduce tambien en plena teoría del conocimiento. ¿Qué conoce un observador de la cosa en sí externa a él, más allá del mundo perceptual de von Uexküll, el único mundo que percibe?

Un caso límite, el realismo: si el "sistema de respuesta de Schacter", X(T), de ese observador, tuviera en cuenta la totalidad de lo que hay que hacer con respecto a la cosa en sí externa- por ejemplo, lo alarmante en sí - ello implica que todas las codificaciones y descodificaciones del miembro de la derecha de la ley son extremadamente precisas y significativas y todo lo percibido de la cosa en sí coincide con la esencia de la cosa.

El caso límite opuesto, el conciencialismo: si el observador conoce lo que debiera hacer X(T), pero poco o nada del término de la derecha es real, la acción X(T) no es apta, porque las codificaciones y descodificaciones, con sus errores, han de disfrazar irreversiblemente la realidad.

Y una tercera postura de racionalidad restringida (Kant, Herbert Simon): el observador considera que el miembro de la derecha de la ley involucra etapas de eficiencia que no es ni infinita ni nula; reconoce que la cosa en sí existe, pero es diferente del mundo perceptual; lo único que puede hacer es codificar y descodificar dicho mundo perceptual, operando no sobre la cosa en sí, sino sobre el fenómeno afectado por dichas sucesivas codificaciones y descodificaciones (fenómeno sin duda distinto de la cosa en sí), adquiriendo experiencia de sentido común sobre lo que puede hacer. Según esta tercera postura, hay una parte de la conciencia que es el sistema (2a) de conciencia fenoménica de Schacter, sistema que fabrica subjetivamente un modelo del mundo objetivo externo, así como hay otro

47.

"sistema ejecutivo central (2b) de Schacter", difícil de separar del anterior, , que gestiona los detalles del término de la derecha de X(T), a la manera que un sistema operativo de una PC gestiona el ratón, el teclado y el monitor y brinda auxilio al cuello de botella de von Neumann.

ANALISIS Y EJEMPLO DE LA LEY DE REPRESENTACION
La ley de representación formulada requiere darse cuenta que dentro del corchete hay un paréntesis, esto es, (CODIFICAR(T)). Indica que primero hay que codificar T descodificado. Esto significa que hay que hallar la matriz (un operador) para el acto de abrir la canilla y cerrarla al llenar el balde grande. ¿A qué se aplica "X codificado", que sabemos por la Fig. 9 que es primero E y luego C? Se aplica a T codificado (lenguaje simbólico de nacimientos y muertes), por lo cual hay que multiplicar entre sí operador y operando simbólico, y al final descodificar (esto es, modificar inventario de grupos familiares en inventario de baldes), para obtener el conjunto operador-operando útil subsimbólico.

Este conjunto implica el resultado, X(T), con lo cual, en el mundo externo de los baldes, se mueve la mano, el sistema motor.

El camino que se ha seguido para partir desde dos baldes vacíos hasta llegar a la meta de dos litros exactos de agua en el balde grande, resuelta por esta técnica, consiste en llenar el balde chico, transferir del chico al grande, llenar el chico, transferir del chico al grande, vaciar el grande y transferir del chico al grande. Son seis matrices u operadores aplicados secuencialmente, descubiertos a partir de pistas E preexistentes (CBR) o de impasses (deliberación). Multiplicados entre sí los operadores, generan un único operador T resultante. Multiplicando el estado inicial por dicho operador resultante, aparece el estado meta, esto es, los dos litros en el balde grande buscados. Interprétese que la "alarma" es la de no disponer de los dos litros en la ubicación correcta. Se verifica que la gestion de dicha alarma se ha logrado por la vía de la deliberación pura la primera vez, pudiendo - con suficiente astucia - "preparar" para una segunda oportunidad, reglas generales que abrevien la solución de "alarmas" similares. Entonces, habrá en tales casos una mezcla de preparación o CBR con deliberacion, Fig 8.

La formula para el estado meta X(T), se llama ley de representación puesto que en el núcleo de la tarea se opera utilizando un lenguaje de representación, esto es, el simbólico, el Gran Salto, las matrices u operadores, las dos familias del ejemplo previo. Para esta ley de representación hay una relación íntima entre percepción, cognición y comportamiento motor. La percepción permite acceder a las señales subsimbólicas de X, y sus pistas de reconocimiento E. La cognición ocurre en el interjuego de las dos memorias, tanto en K como en plena memoria rápida. El comportamiento motor es el resultado de las señales subsimbólicas A, resultado que es X(T). El sistema Soar cumple con esta ley. Interpretese que las Figs 10 y 12 son simplificaciones esquemáticas de la Fig 13, donde en T se resume toda la tarea de cognición K.

Mediante la Fig 14, se pueden interpretar dos puntos de vista complementarios de la relación entre percepción P, cognición K y acción motora M, así como de los mecanismos codificantes C y descodificantes D. Repasando, el sistema total es bastante más que Percepción P + Cognición K+ Acción motora M. Porque además hay un conjunto de producciones basadas en las pistas E que resultan ser las producciones codificadas C, pistas que disparan libremente, libres de listados de objetivos, libres de

48.


------------------------------------------------------------------------
    _____         _____                    ____________________
   |     |       |     |                  |                    |
   |  C--|---K---|--D  |                  |   C------K------D  |
   |  |  |       |  |  |                  |___|_____________|__|
   |  P  |       |  M  |                      |             |
   |_____|       |_____|                      P             M

-------------------------------------------------------------------------
Fig 14- Dos visiones complementarias del suprasistema cognitivo, P-C-K-D-M. A la izquierda aparecen dos subsistemas, P-C y D-M, que unifican funciones. A la derecha aparece un subsistema C-K-D, que cumple tanto un papel en la estructura como un papel en el aprendizaje. A la izquierda, los dos grandes saltos de Newell quedan incorporados a cada uno de los dos modulos, siendo la suma de P y C la alarma o el problema filtrados, K la gestión y la suma de D y M es la motorización. A la derecha los referidos grandes saltos sirven de límite al modulo central. Ambas interpretaciones de P-C-K-D-M tienen su merito e incorporan diferentes detalles. Algunos científicos del conocimiento se niegan a atribuirle módulos al cerebro, postura coherente con la ambigüedad mostrada en este diagrama doble.
---------------------------------------------------------------------------

la tarea de organización de espacios de problemas, típicas de las primeras versiones de Soar (actualmente ellos son auxiliares de los estados, cada uno de ellos con su asociado espacio). Las nuevas producciones C se acondiciónan de tal manera que los esfuerzos limitados de la cognición central sean suficientes para procesarlos, K. K interactúa con la memoria de trabajo, donde aparecen los espacios de problema y sus correlatos, los listados de objetivos. Siguen a continuación, luego de K, otras producciones descodificadas D, tambien preacondicionadas para un fácil procesamiento muscular o motor, M. Los módulos principales son P-C-K-D-M.

En el caso de una alarma, P-C producen atención o alerta, por lo cual, una secuencia defendible es la de P-C-(Alerta)-K-D-M, donde el módulo de Alerta disminuye en importancia con problemas y con juegos.

A la izquierda de la Fig 14 hay dos interfases unificantes. Una de ellas integra los módulos P y C, señalando que la percepción es la suma de P y C, donde P abarca al componente sensorial y C es la codificación perceptual de dicho componente, que servirá de pista para la memoria de reconocimiento K. La otra es la interfase unificante entre D y M. El sistema motor es funcionalmente D+M. D es el componente descodificador y de control local sobre músculos, mientras que M es el actuador, existente también en los sistemas de control artificiales. Resta, aislado, el módulo cognitivo central K, que satisface la tarea de supervisar la transducción entre el estímulo (la percepción) y la respuesta (la acción motora), Fig 10.

A la derecha de la Fig 14 aparece la estructura del sistema cognitivo. P y M, aislados, son una colección de mecanismos que por un lado (P) transduce energías y moléculas ambientales en representaciones internas (lo cual tiende a ser cuesta abajo energéticamente) y que por el otro lado (M) consume bioenergía para generar acciones reales a partir de producciones mentales (consumo que es cuesta arriba en términos energéticos). La tarea de C+K+D y de la memoria rápida seria, así, energéticamente espontánea, estaría basicamente en un valle de energía. Exagerando, se puede conjeturar que es espontáneo entrar en alerta frente a una alarma externa, casi siempre rica en energía, asi como es espontáneo pasar del sueño a la vigilia, con la ayuda de una oportuna descarga de cortisol. Bioenergeticamente esta exageración es válida para gestionar alarmas y para vivir en vigilia, pero deja de serlo para las tareas intelectuales superiores.

49.


--------------------------------------------------------------------------
             TAREAS ASOCIADAS CON LA MEMORIA DE LARGO ALCANCE
             ------------------------------------------------
LOGICA DE CONTROL (asociada con el Sistema Operativo, con mezclas de
Deliberación y de Preparación).
   * CONOCIMIENTO ACERCA DE LA IMPLEMENTACION DE TAREAS EN EL ESPACIO DE
      PROBLEMA, entre las cuales son fundamentales las siguientes
      "funciones primitivas":
        *Selección de un estado entre todos los  disponibles directamente
        *Reconocimiento del espacio de problema asociado con el estado
            actual
        *Selección de un operador, p.ej. el 2 de la parte inferior
        *Aplicación de dicho operador para acceder a un nuevo estado
   * CONOCIMIENTO ACERCA DEL CONTROL DE BUSQUEDA DEL ESTADO META:
        *Evaluación de la diferencia entre lo actual y lo ideal
        *Insistencia antiespontánea en el uso de operadores diferentes
---------------------------------------------------------------------------
                  TAREAS ASOCIADAS CON LA MEMORIA RAPIDA
                  --------------------------------------
* MONITOREO DEL ESTADO ACTUAL DEL MUNDO DE LOS BALDES Y DE SU ESPACIO DE
PROBLEMA ASOCIADO
    * Aqui se implementan las mismas "funciones primitivas" descriptas.
                                    .....
                                   !.....!
                           /       !.....!  !     !
                          /1       !.....!  !     !
                         /          -----    -----
                        /             !     !   .....
 ESTADO INICIAL ---->  o -OPERADORES->!     !  !.....!------->ESTADO META
 !     !                \            2!     !  !.....!     !     !
 !     !   !     !       \             -----    -----      !.....!!     !
 !     !   !     !        \3                               !.....!!     !
  -----     -----          \      !     !                   -----  -----
                            \     !     !  !     !
                                  !     !  !     !
                                   -----    -----
--------------------------------------------------------------------------

Fig 15.- Desdoblamiento de las tareas a realizar entre las asociadas con la memoria de largo alcance y las asociadas con la memoria rápida, separadas por una linea horizontal. En la parte superior, se anotan algunas contribuciones de la lógica de control (Fig 11): el conocimiento para implementar operadores y el conocimiento para monitorear la búsqueda del estado meta multiplicando operadores y operandos ("funciones primitivas"). Con su ayuda se revisa el espacio de problema para satisfacer la meta. En la zona inferior aparecen aplicaciones del mundo de los dos baldes. Hay alli tres estados, el estado inicial, el actual y el meta. Ubicado en el estado inicial (los dos baldes vacíos), se debe evaluar la diferencia con el estado meta (el grande parcialmente lleno) y se debe tratar de reducir la diferencia. Esto requiere la ayuda de operadores, que en esta primera etapa esquematizada son tres, a saber, 1 llenar el grande, 2 llenar el chico y 3 transferir de uno a otro (trivial). Se llama conducta a la acción motora en respuesta a dicha búsqueda.
---------------------------------------------------------------------------

En resumen, queda un núcleo unificado de producciones C+K+D, que quizás satisfagan un mecanismo único generador de todo tipo de producciones, con lo cual la teoría unificada de la cognición lograría, con un nítido avance, teorizar sobre el aprendizaje perceptual, el aprendizaje cognitivo y el aprendizaje de acciones motoras, como emergiendo de una explicación mecanística única, explicación que copia lo modelizado de la causa del reconocimiento en K, también para C y para D. La causa del reconocimiento en K, que resulta por el modelo común también a C y a D, es el troceado (Apéndice 8).

En la Fig 15 se ilustra la arquitectura del espacio de problema, referido al caso del mundo de los dos baldes.

Todas las tareas imaginables pasan (en este modelo Soar) por sus diferentes estados y sus asociados espacios de problema. Los sentidos informan la condición inicial. El listado de metas u objetivos permite generar conductas. Los subobjetivos se crean automáticamente a partir de la aparición de impasses.

En la Fig 16 se observa un detalle de la tarea de flujo de información subsimbólica entre la memoria de largo alcance (especializada aqui en su tarea de memoria asociativa) y la memoria de trabajo.


-------------------------------------------------------------------------
       MEMORIA ASOCIATIVA (una parte de la memoria de largo alcance)
                * Ejecución de producciones Km  *** --> oo

K1             C1  y C2   y C3   --operador->  A1  , A2

K2                    C4  y C5   --operador->  A3

K3     C6  y  C3  y  C5  y  C7   --operador->  A1  , A4
-----------------------------------------------------------------------
                ! Ej !                              ! An !
------------------------------------------------------------------------
            MEMORIA DE TRABAJO (una parte de la memoria rapida)

                           E1  , E2  , E3  ,...
---------------------------------------------------------------------------
Fig 16. Como en figuras previas, la linea horizontal separa dos memorias distintas. La memoria de trabajo alberga una colección de elementos de datos Ej. De esa colección filtra pistas, similitudes o fragmentos de sus elaboraciones Ej, que envia a la memoria de largo alcance, como elementos que se codifican, Cl. Con la ayuda de estas pistas codificadas, Cl, la memoria asociativa las asocia con otras pistas Cl' análogas, que alberga. Con algunas de ellas arbitra producciones codificadas Km (con aportes de los espacios de problemas) que se devuelven, descodificadas, An, como acciones motoras. Las producciones cognitivas Km, de las cuales se muestran tres ejemplos, pueden ser miles en dos segundos. Tienen la forma de un estado inicial u operando inicial C, que mediante un operador se transforma en una acción descodificada A. Nótese que por analogía con lo que se modeliza para espacios de problema, la transformación de los operandos C codificado en A descodificado, de nuevo se realiza con operadores. D (omitido en este esquema) ocurre entre K y A. Queda claro que las alarmas tienen componentes alarmantes y componentes neutros. Ej los abarca a ambos. Las producciones de la memoria asociativa se generalizan con estos símbolos abreviados:

*** ---> oo
y largos:
x + x' + x" ---operador---> y + y'.
Esta típica tarea intelectual no ocurre sin inconvenientes. Lo habitual es que el proceso se trabe. En el sistema cognitivo K, el mecanismo para la conclusión a extraer necesita bioenergía. El motivo reside en que, en la experiencia previa, no hay registrada solución

*** --> oo
exactamente
51.

igual a la planteada por los inputs Ej. Se debe proceder por analogía. Es el momento cuando el sistema cognitivo aprende. No aprende durante la deliberación ni durante la preparación o CBR. Todo el resto se supone, ya sea aprendido, ya sea heredado (si se trata de un sistema cognitivo biológico) o precableado (si se trata de un sistema artificial). Esta etapa se denomina impasse de Newell y consiste en aplicar al caso la creación de un espacio de problema con la meta de salir de la impasse (Apendice 8). De esto se deduce la necesidad de un listado de objetivos o metas asociados con impasses, adelantada en la Fig 12.

Queda explicado que la acción A es función de los datos aportados por los sentidos fisiológicos y por el reservorio de experiencias.

 
 A= f(datos externos con sus pistas, experiencias previas con sus pistas)
f ocurre en P-C-K-D-M, aunque en especial en el espacio de problemas conectado a K y su receta es fuertemente educable, en C-K-D.

Allen Newell define como alto nivel de inteligencia, al que caracteriza a un sistema que, antes de actuar, intenta reconocer, si las hubiera, todas las pistas similares a las recién ingresadas, barriendo las experiencias, reglas y metarreglas previas registradas.

Biologicamente muchas alarmas o aun tareas no asociadas con alarmas, exigen un proceso *** ---> oo urgente de ciertas señales alarmantes del ambiente. Esto es explicable con la misma cascada P-C-K-D-M, aunque la version rápida (CBR) de dicho proceso no siempre llega a satisfacer la totalidad de lo requerido para resultar una respuesta inteligente (racional). Es innata (irracional), o resultante de un entrenamiento.

Soar, el primer modelo importante de inteligencia artificial compite con otros modelos que van apareciendo, de los cuales el ACT-R (Anderson, Lebiere) es excelente (Johnson TR). Soar muestra numerosos logros en su lista de parecidos con la actividad cognitiva humana. Por ejemplo: * Es un sistema simbólico capaz de abstracciones.

* Segun las circunstancias, muestra conducta ya sea automática, ya sea controlada, ya sea adaptiva. Se adapta a las contingencias sin plan previo.

* Está basado en un comparador generador de alarma por reconocimiento de pistas. El reconocimiento es fuertemente asociativo, sin mostrar de antemano un acceso deliberado a todo lo que conoce. Eso limita su inteligencia, definida en párrafos previos.

* Aprende de la experiencia (usando su registro de pistas). Recordar puede ser un problema, que se puede encarar con la técnica del espacio de problema.

* Es de rápida lectura de estímulos del mundo externo y, en general, de lenta respuesta.

* Está orientado a metas y objetivos, no sólo porque aprende metas, sino porque las metas se autogeneran por interacción con el ambiente.

* Está guiado por interrupciones, con búsqueda local que primero se introduce en alguna rama del árbol decisional y luego profundiza en ella. Contrariamente al General Problem Solver, carente de distracciones, aparecen distracciones naturales en el circuíto decisional. No sabe como va realizando su tarea, aunque es capaz de reconstruir lo que acaba de hacer.

* Es un proceso en serie en el medio de un paralelismo generalizado.

* Su conducta por defecto es fundamentalmente adaptiva; se adapta a las contingencias sin un plan previo.

Muchas de estas características serán notables en el modelo de arquitectura cerebral que se ha de proponer a partir del paragrafo 21.

52.

Newell A - Unified Theories of Cognition, Harvard University Press, 1990
Rosenbloom, Laird and Newell - The Soar Papers, 1993.
Ritter F - Introduction to the Soar Cognitive Arquitecture, WWW On-line
Ritter F - Soar, Frequently Asked Questions (FAQ's), WWW On-line, 1996.
Anderson JR - The Adaptive Character of Thought, Lawrence Erlbaum, 1990
Lebiere C - Act-R, A Users Manual, WWW On-line, 1996
Johnson TR - Control in Act-R and Soar, WWW On-line, 1996.
Uexküll JJ von - The Theory of Meaning, Semiótica 42 (1) 25-

No hay comentarios: