martes, 18 de junio de 2013

La gestión del conocimiento no es manipulación de datos

Una simple asociación de ideas en un sistema de información puede ser tan trivial como el ordenamiento de unos cuantos datos en una tabla. Por ejemplo:

UniversidadPrograma académico
ABCPsicología
ABCAdministración
DBFPsicología


Por lo tanto: adquirir la información, almacenarla y mostrarla no requiere de mayores traumatismos. Eso se hace en los sistemas de información.
En cambio, cuando hablamos de sistemas de conocimiento, el objetivo es que se pueda responder preguntas.
En la anterior estructura de datos de información, hay un conocimiento que puede ser respondido por quien entiende de ordenamiento de datos.  Pero ¿qué hay que tener en cuenta para que sea respondido por un sistema de conocimiento?



Las variables a tener en cuenta son:
  1. El sistema de conocimiento debe tener claro el conocimiento. En pocas palabras, debe tener bien estructurado en su almacenamiento de datos que la universidad ABC tiene la carrera de Psicología.
  2. Pueden existir dos formas diferentes para que le hagan preguntas al respecto. Por ejemplo: ¿En qué universidad dictan la carrera de psicología? y/o ¿Qué carrera se dicta en la universidad ABC? En el mayor de los casos hemos logrado hacer una conjugación hasta de 420 maneras diferentes de hacer la misma pregunta.
  3. Los datos no son solamente palabras, también son ideas. Al momento de hacer referencia de un dato puede llegar a tener muchas opciones en el texto que son representadas en la misma idea. En pocas palabras, unPrograma académico se puede referir también a "carrera universitaria", "Estudio de pregrado", "Plan de estudio universitario", entre muchos otros.
  4. Algunas preguntas son simplemente de validación. Muchas veces los usuarios tratan de validar sus propios conocimientos. Por ejemplo: ¿En la universidad ABC dictan la carrera de Agronomía? o ¿En ABC dictan la carrera de Psicología? Es posible que la primera tenga una respuesta negativa o simplemente no se sabe, y en el segundo caso la respuesta es obviamente afirmativa.
  5. Algunas culturas humanas no hacen preguntas, sino que expresan un problema, pero intrínsecamente están esperando que les respondan las mismas preguntas. En este caso, también hay dos maneras de expresar el mismo problema. Por ejemplo: No tengo la menor idea de donde estudiar psicología. O en el caso inverso: No se qué programas dictan en la universidad ABC. En el mayor de los casos hemos logrado conjugar hasta 560 maneras diferentes de plantear el mismo problema.
  6. Debe ser flexible con los errores de ortografía. Dependiendo del nivel educativo de la persona, pueden existir errores de ortografía en el contenido: Psicología puede estar escrito como: psicologiasicologíasicolojia,psicolojíapsycologia, entre muchas otras (hemos llegado a encontrar hasta 54 formas diferentes de corrección ortográfica para una sola palabra)
  7. Debe ser flexible con los errores gramaticales. Al hacer juegos de palabras no es de extrañar que posiblemente el usuario en su afán, o manera de expresarse omita palabras, las intercambie o confunda géneros y/o plurales de los sustantivos. Nuestro corrector gramatical cuenta en la actualidad con un poco más de 1300 reglas gramaticales de corrección automática, y creciendo.
  8. Debe ser intuitivo para detectar si el usuario supo hacer o no la pregunta. Algunas veces las preguntas son tendenciosas, buscando que el sistema se confunda o simplemente, el usuario no está seguro de qué preguntar. Por ejemplo: ¿Qué carreras se dictan en Psicología? Dependiendo de la experiencia y conocimiento que el sistema de conocimiento tenga de Psicología, puede ofrecer otro tipo de preguntas.
  9. Debe manejar la ambigüedad de la pregunta. Muchas veces los usuarios esperan que se sobre entienda lo que ellos ya conocen, pero si no se da toda la información de manera explícita en la pregunta, entonces no hay suficientes datos para procesarla. Por ejemplo: ¿En dónde hay psicología? Aquí el usuario no preguntó por universidad alguna, es más la pregunta es tan abierta y ambigüa que puede referirse a muchos otros temas y no precisamente al estudio en una universidad.
  10. Si se trata de un sistema de conocimiento multiusuario o de inteligencia múltiple, debe tener claro qué le puede contestar quién.
  11. El conocimiento puede tener validez en el tiempo. Tal vez este programa ya no sea para este año académico, sino que se dictó hasta hace 5 años.
  12. La negativa también es una respuesta. Si se está seguro que ya no se dicta Ingeniería, debe contestar que no se dicta dicha carrera.
  13. El desconocimiento también es una respuesta. Nunca le han negado o confirmado al sistema de conocimiento si en la Universidad ABC se dicta o no Derecho Penal, por lo tanto, el desconocimiento es también una respuesta válida.
  14. El conocimiento es global. Una de las fortalezas del manejo de inteligencia artificial en Solutecia es el hecho que soporta multiples idiomas, puesto que las ideas no deben depender de la manera en que está escrito, actualmente al momento de escribir este artículo, el banco de conocimiento de Solutecia soporta 33 idiomas diferentes.

En este simple ejercicio hemos logrado desarrollar en M.I.A. (Motor de Inteligencia Artificial de SOLUTECIA), cubrir todas estas variables, de manera que poniendo todas estas variables en una simple ecuación, la dificultad no reside en qué es lo que ha aprendido el sistema de conocimiento, sino en poder detectar las maneras en que se lo van a preguntar y qué tipo de respuesta dar.  Si el sistema de conocimiento es capaz de sobrellevar estas 14 variables, entonces realmente ha contestado bien.  En la actualidad hemos logrado llegar al 86% de asertividad en este proceso.
En nuestra página de estadísticas se puede ver la evolución de dicho avance de conocimiento.

No hay comentarios: