Programación Lógica y Recuperación de Información

DCG: notación de reglas gramaticales en Prolog

2006-03-06T18:37:00.000+01:00

La notación de reglas gramaticales DCG (Definite Clause Grammar, en castellano gramática de cláusulas definidas) es una variante o extensión sintáctica de la sintaxis ordinaria del lenguaje Prolog, cuyo objeto es implementar gramáticas formales de forma abreviada, y en consecuencia simplificar y hacer más legibles los analizadores sintácticos escritos en este lenguaje, ya que permite manejar información (entiéndase por ésta "variables") implícita. Su expresión es una notación abreviada de la sintaxis del lenguaje Prolog, recogida por la práctica totalidad de los parsers e intérpretes actuales para este lenguaje, que la transforman automáticamente y de forma interna en cláusulas normales. En la notación DCG el operador infijo ":-" es sustituido por el operador del mismo carácter "-->", y se puede establecer, a modo de ejemplo, la siguiente correspondencia entre notaciones, siendo la primera la cláusula Prolog en sintaxis ordinaria, y la segunda la notación DCG equivalente:

oracion(S0,S) :- sintagma_nominal(S0,S1), sintagma_verbal(S1,S).
oracion --> sintagma_nominal, sintagma_verbal.

La anterior cláusula Prolog se expresa en palabras como sigue:

"Existe una oración entre S0 y S si existe un sintagma nominal entre S0 y S1, y existe un sintagma verbal entre S1 y S"

La notación DCG se basa en la utilizada para las gramáticas libres de contexto (context-free grammars o CFGs, N. Chomsky), estructura jerárquica que indica las relaciones de las construcciones del lenguaje, descritas mediante notación BNF (Backus Normal Form ó Backus-Naur form), creada originalmente para definir la estructura sintáctica del lenguaje ALGOL60 (1960, John Backus), y muy utilizada tanto para definir la estructura sintáctica de los lenguajes de programación, como para definir estructuras sintácticas de los lenguajes en general. Por tanto, mediante notación DCG, es posible manejar directamente en lenguaje Prolog gramáticas libres de contexto. Las gramáticas libres de contexto vienen a ser una simplificación de la gramática ordinaria, que, por ejemplo, y referida al idioma castellano, podría adoptar la siguiente expresión en notación DCG:

oracion --> sintagma_nominal, sintagma_verbal.

sintagma_nominal --> determinante, nombre.

sintagma_verbal --> verbo, sintagma_nominal.
sintagma_verbal --> verbo.

determinante --> [el].
determinante --> [la].

nombre --> [hombre].
nombre --> [manzana].

verbo --> [come].
verbo --> [canta].

Que el sistema Prolog (en este caso SWI-Prolog) traduce automáticamente al siguiente conjunto de cláusulas:

oracion(A,B):- sintagma_nominal(A,C),
sintagma_verbal(C,B).

sintagma_nominal(A,B):- determinante(A,C),
nombre(C,B).

sintagma_verbal(A,B):- verbo(A,C),
sintagma_nominal(C,B).
sintagma_verbal(A,B):- verbo(A,B).

determinante([el|A],A).
determinante([la|A],A).

nombre([hombre|A],A).
nombre([manzana|A],A).

verbo([come|A],A).
verbo([canta|A],A).

Como es fácilmente deducible, el programa basado en esta pequeña y muy limitada gramática, solo aceptará como oraciones gramaticalmente correctas "el hombre come la manzana", "el hombre canta", y combinaciones similares, incluso por ejemplo frases a todas luces gramaticalmente incorrectas como "la manzana canta", "la hombre come", etc., devolviéndonos una lista vacía, pero no aceptará por ejemplo "el hombre baila" (el verbo "baila" no se halla dentro de la base de hechos o conocimiento del programa). Se entiende por tanto que una gramática completa, que abarque todas las posibles estructuras, relaciones y combinaciones de las partes constitutivas de una lengua, requiere un programa muy complejo y difícil de implementar. En el ejemplo expuesto, se pueden obtener todas las oraciones aceptadas como gramaticalmente correctas por la gramática del programa, lanzando en el intérprete el siguiente objetivo:

?- oracion(X,[]).

Por su parte, un ejemplo muy sencillo de gramática para el idioma inglés, escrita mediante notación DCG, adopta la siguiente expresión:

sentence --> noun_phrase, verb_phrase.

noun_phrase --> noun.
noun_phrase --> determiner, noun, rel_clause.

verb_phrase --> verb.
verb_phrase --> verb, noun_phrase.

rel_clause --> [].
rel_clause --> [that], verb_phrase.

determiner --> [the].
determiner --> [a].

noun --> [john].
noun --> [annie].
noun --> [man].
noun --> [men].
noun --> [woman].
noun --> [women].
...

verb --> [like].
verb --> [likes].
...

En la notación DCG se suprimen dos parámetros, una lista de entrada, y una lista de salida. La primera puede estar representada, por ejemplo, por la oración [el,perro,muerde] y la segunda por una lista vacía [] que es el resultado de comprobar la estructura sintáctica de dicha oración en función del parser utilizado. Adicionalmente, es posible agregar variables a las gramáticas representadas mediante notación DCG, por ejemplo para especificar el género y el número.

Como se ha dicho anteriormente, la notación DCG permite añadir argumentos adicionales, y también incorporar objetivos Prolog en el cuerpo de las reglas, estos últimos encerrados entre llaves {}. Los argumentos adicionales nos permitirían por ejemplo introducir las reglas gramaticales correctas en función de las convenciones adoptadas por la lengua objeto de representación, y así evitar incorrecciones en la concordancia género / número, etc. También, mediante notación DCG también es posible construir programas capaces de representar árboles de análisis de una oración (que representan las categorías gramaticales implicadas en la descomposición de sus partes), y árboles sintácticos (parse trees) que de una forma gráfica muestran la estructura en forma de árbol descendente de determinada construcción gramatical. Como explicamos en la anterior anotación, los analizadores sintácticos o parsers se encargan de la construcción de árboles de análisis de las oraciones de una lengua, capaces de representar la estructura sintagmática de las mismas. Siguiendo con el ejemplo de la sencilla gramática en castellano, expuesto más arriba, la representación gráfica del árbol de análisis de la oración "el hombre come la manzana" presenta el siguiente aspecto, haciendo uso para ello de este programa:

?- draw(o(sn(d(el),n(hombre)),sv(v(come),sn(d(la),n(manzana))))).

                       o
                       |
        +--------------------+
        sn                   sv
        |                    |
   +-------+        +------------+
   d       n        v            sn
   |       |        |            |
   |       |        |      +--------+
   |       |        |      d        n
   |       |        |      |        |
   |       |        |      |        |
   el    hombre    come    la    manzana

Donde "o" = oración, "sn" = Sintagma Nominal, "d" = Determinante, "n" = Nombre, "sv" = Sintagma Verbal, y "v" = Verbo. Hay que advertir que este programa no realiza el árbol de análisis propiamente dicho, que es:

o(sn(d(el),n(hombre)),sv(v(come),sn(d(la),n(manzana))))

Simplemente lleva a cabo su representación gráfica en forma de diagrama de caracteres ASCII. El código fuente del programa en cuestión, que originalmente se llama draw.swi, ha sido copiado a un editor de texto plano, y salvado con la extensión ".pl" para poder ser ejecutado por el intérprete SWI-Prolog, aunque otra opción es asociar los archivos con extensión ".swi" con el ejecutable de dicho intérprete. Su autor es Bertram Ludäscher, de la "University of California Davis".

Los ejemplos de notación DCG y Prolog en castellano se han tomado del capítulo 9, "Uso de reglas gramaticales en Prolog", apartado 9.1, "El problema del análisis sintáctico", de la obra de W.F. Clocksin y C.S. Mellish "Programación en Prolog" (2ª ed.; Barcelona: Gustavo Gili, 1993; ISBN: 84-252-1339-8), traducción del original en inglés "Programming in Prolog", a la que me remito para obtener una explicación detallada sobre reglas gramaticales, análisis sintáctico, y notación DCG en Prolog, habida cuenta de que los autores reseñados hacen una exposición clara y perfectamente comprensible sobre el particular, perfectamente asequible para las personas no excesivamente versadas en este lenguaje.

Por su parte el ejemplo de gramática en inglés se ha obtenido del capítulo 17, "Languague Processing with Grammar Rules", de la obra "Prolog - Programming for Artificial Intelligence" (Ivan Bratko, 2ª ed.; Addison-Wesley, 1990; ISBN: 0-201-41606-9). Se trata de un libro muy recomendable, de nivel más avanzado y completo que el de Clocksin y Mellish, claramente más introductorio, y como su propio nombre indica cubre por un lado las generalidades del lenguaje Prolog, y por otro lado su aplicación a las principales técnicas del campo de la IA (búsqueda y clasificación, sistemas expertos y representación del conocimiento, PLN, Machine Learning, etc.).

Por último, mencionar otro ejemplo de utilización práctica de la notación DCG y el lenguaje de programación lógica Prolog, la librería Html-write [1] [2] [3] del intérprete y entorno de desarrollo SWI-Prolog, que traslada términos Prolog en HTML, generando salidas en este último lenguaje, para lo cual hace uso precisamente de estructuras escritas en notación DCG.

Más información (PLN y DCGs en Prolog):

Adventure in Prolog - 15. Natural Language.
En Learn Prolog Now!: 7. Definite Clause Grammars, 8. More Definite Clause Grammars (P. Blackburn, J. Bos, K. Striegnitz).
Logic, Programming and Prolog - 10. Logic and Grammars (monografía, en formato PDF; U. Nilsson, J. Maluszynski).
Natural Language Processing in Prolog (G. Gazdar, C. Mellish; otra ubicación).
Parsing in Natural Language Processing (Julia Lavid).
Parsing Techniques - A Practical Guide (monografía, varios formatos; D. Grune, Ceriel J.H. Jacobs).
Parsing techniques in Prolog (monografía, formato ".doc"; Klaus von Bremen).
Prolog and Natural-Language Analysis (monografía, formato PDF; F.C.N. Pereira, S.M. Shieber).
Prolog Tutorial - 7. Introduction to Natural Language Processing (J.R. Fisher).
Prolog Tutorial - Definite Clause Grammars (A. Aaby; otra ubicación).
Natural Language Processing (A. Aaby).
A Natural Language Processor (A. Aaby).
Quick Prolog - Definite Clause Grammars (D.S. Robertson).
Extended DCG's: Declarative Programming with State (Peter Van Roy).
ProNTo - Prolog Natural Language Tools.

Específicamente sobre DCG:

CFGs y BNF:

Forman parte del mismo conjunto de lecturas de clase:

Analizadores sintácticos y tokenización

2006-02-27T01:55:00.000+01:00

Dentro del complejo y amplio ámbito de dominio del Procesamiento del Lenguaje Natural (PLN), una de las funciones esenciales de los analizadores sintácticos o parsers es el análisis de cadenas de tokens en busca de posibles errores sintácticos (recordemos que la sintaxis, entendida en sentido amplio, es aquella parte de la gramática que se ocupa de las normas que rigen la formalización de las palabras en estructuras mayores tales como las oraciones, así como de las relaciones que establecen entre si dichas palabras). Un token se puede definir como la unidad mínima de información con significado propio dentro de una secuencia de caracteres alfanuméricos. Estas cadenas de unidades mínimas de información o unidades léxicas, son generadas previamente por el módulo lexicográfico integrado en el parser, encargado de identificarlas dentro de un texto o secuencia ordenada de caracteres alfanuméricos. Por su parte, la tokenización es un proceso consistente en la descomposición, en forma de lista, de esas cadenas de tokens en sus unidades mínimas. Así, un programa de este tipo podría generar la siguiente lista de tokens a partir de la frase "¡Hola Mundo!":

[161, 72, 111, 108, 97, 32, 77, 117, 110, 100, 111, 33]

Donde cada uno de los números de la lista se corresponde con el carácter ASCII (American Standard Code for Information Interchange) correspondiente a cada una de las unidades mínimas de significación identificadas en la frase, en el mismo orden. Por supuesto es posible llevar a cabo el proceso inverso, y a partir de esa lista generar las cadenas de tokens que forman la frase en cuestión. La tokenización es por tanto el proceso básico que permite manejar el lenguaje natural escrito para su posterior procesamiento, en base a su descomposición en unidades mínimas de información con significado propio.

La mayor parte de los lenguaje de programación contemplan instrucciones específicas para llevar a cabo el proceso de tokenización de cadenas ordenadas de caracteres alfanuméricos, si bien es posible implementar alternativamente esta operación mediante otros procedimientos proporcionados por esos lenguajes.

Así, un programa que pretenda "leer" un texto, deberá en primer lugar "tokenizarlo", generando una lista de los tokens, o unidades léxicas mínimas con significado propio, identificados en ese texto. A continuación, procederá a identificar unidades mayores de significado propio (contemplando por ejemplo la presencia, como elemento separador, del carácter ASCII 36, que se corresponde con el espacio en blanco), lo que podríamos asimilar como "palabras", para, finalmente, acabar identificando otras unidades de significación de orden superior, frases u oraciones. Diferenciadas las oraciones del texto "leído", el parser procede a realizar el análisis sintáctico propiamente dicho, identificando para ello las partes constitutivas de dichas oraciones que, a tal fin, son comparadas con patrones previamente definidos de estructuras posibles, que dependerán de la lengua de escritura del texto, y del nivel de complejidad de análisis que se pretenda alcanzar, ya que contemplar todas las posibles estructuras de una lengua y sus numerosas variaciones, y representarlas mediante una serie de reglas, no es una tarea precisamente sencilla.

La detección de las variaciones de posición admitidas en cada lengua, en relación con el orden de las palabras, o análisis de las transformaciones, se realiza mediante procesos de análisis estructural que tratan de identificar la estructura profunda de una oración en relación con su estructura superficial. El análisis estructural, en base a la estructura superficial (2) de una oración y, cambiando el orden de determinadas palabras, trata de determinar su posible transformación a una estructura de tipo profundo (1):

(1) Estructura profunda: "Pedro come una manzana"
(2) Estructura superficial: "Come Pedro una manzana"

La implementación del proceso de tokenización, al margen de la utilización de instrucciones específicas que transforman directamente una cadena de caracteres alfanuméricos en una cadena de tokens, implica la utilización de otro tipo de instrucciones cuya función es la "lectura" individual, uno a uno, de los caracteres presentes en el canal o grupo activo de entrada de datos (input stream) que se halla especificado, que por lo general será bien el teclado del ordenador, que es el canal activo de entrada por defecto (al igual que el canal de salida de datos, output stream, por defecto es el monitor del ordenador), o bien un fichero de texto ubicado en la ruta que se indique.

Así, en el lenguaje Prolog existe el predicado predefinido name(?AtomOrInt, ?String). El argumento AtomOrInt es la variable que representa la cadena de caracteres alfanuméricos o "átomo" que se desea tokenizar, mientras que el argumento String es la variable que representa la lista resultante. El símbolo "?" indica que ambos argumentos son reversibles, es decir, que pueden funcionar tanto como variables de entrada de datos como variables de salida, si bien uno de ellos ha de estar necesariamente instanciado. Su modo de funcionamiento es el siguiente:

?- name('¡Hola Mundo!', X).

X = [161, 72, 111, 108, 97, 32, 77, 117, 110|...] [write]

X = [161, 72, 111, 108, 97, 32, 77, 117, 110, 100, 111, 33]

Yes

La indicación [write] simplemente expresa que, una vez que el intérprete proporciona la lista de tokens, incompleta como indica la barra vertical seguida de puntos suspensivos "|...", se ha tecleado el operador w para que ésta se muestre en toda su extensión, ya que, en este caso SWI-Prolog, muestra por defecto en pantalla una versión abreviada de las listas, cuando estas exceden determinada longitud (no obstante se pueden obtener listas completas utilizando el comando "w", tal y como se explica en esta página).

Por supuesto, existen más predicados para la manipulación de átomos, como se referencia en el apartado "Analysing and Constructing Atoms" del manual de SWI-Prolog.

Otra forma de tokenizar átomos en Prolog es utilizar el predicado get0/1 y get0/2 y algún tipo de algoritmo recursivo que vaya "recorriendo" todo el texto del canal activo de entrada de datos (un archivo externo, por ejemplo), y al tiempo introduzca los tokens resultantes, incluyendo los espacios en blanco (get/1 y get/2 no los leen), en una lista acumuladora, en tanto no se alcance determinado marcador de parada, definido previamente (para este fin suele aprovecharse el átomo end_of_file, que se corresponde con el final de texto). Este predicado realmente lee el byte correspondiente a cada carácter alfanumérico individual, asociándolo con su correspondiente código ASCII.

El analizador sintáctico, en base a los constituyentes de una oración (véanse los principios de la gramática generativa de Noam Chomsky), y mediante un número finito de reglas, trata de determinar la gramaticalidad o no de un número infinito de construcciones. Un analizador sintáctico trata de ver hasta que punto puede someterse un grupo de palabras a una estructura de reglas. Así por ejemplo, si tenemos la oración:

Pedro come una manzana

en primer lugar, y mediante un proceso de tokenización, se genera una lista de las palabras que contiene. De esta lista inicial de palabras, se puede diferenciar una sublista que se corresponda con el Sintagma Nominal (SN) de la oración, y si ésta puede concatenarse con otras sublistas que según determinadas reglas se verifica como Sintagma Verbal (SV), la oración se concluye que es gramatical. Lo que importa en los constituyentes es el orden de las palabras de la oración.

El analizador sintáctico realiza el análisis secuencialmente, palabra por palabra, partiendo de una lista inicial que, siguiendo con el ejemplo de la oración expuesta, sería:

[pedro,come,una,manzana]

El proceso de computación de las reglas del analizador sintáctico debe dar como resultado otra lista, que será una lista vacía [] si la oración inicial es gramatical (siempre en base a las reglas que tenga definidas el analizador). En definitiva, partiendo de la lista inicial de palabras, el analizador sintáctico comprueba si ésta se puede subdividir en dos sublistas, que se corresponden, respectivamente, con el SN y el SV de la oración.

Más información: El análisis sintáctico y el análisis semántico.

¿Ha llegado el fin de los tesauros documentales?

2006-02-19T12:08:00.000+01:00

Aunque no suele ser mi costumbre publicar integramente textos completos en este sitio (para esos menesteres mantengo abierto Visto y Leído), me permito hacerlo en esta ocasión dado el indudable interés que tiene el que reproduzco a continuación, en función de las ideas que plantea, las experiencias prácticas puestas de manifiesto y compartidas por el autor, y el debate que todo ello pretende suscitar. Se trata de un mensaje enviado por José Ramón Pérez Agüera (Departamento de Sistemas Informáticos y Programación, Facultad de Informática, Universidad Complutense de Madrid) a la lista de distribución IWETEL, el pasado 13/02/2006 (para acceder al texto original, en el apartado de archivos, hace falta estar suscrito a dicho foro de discusión para profesionales del ámbito de las bibliotecas y los centros de documentación).

[Comienza el texto de Pérez Agüera]

"Aunque no me toca publicar nota en Thinkepi, llevo unos meses (de hecho algún año que otro) dándole vueltas a este asunto y me gustaría contar con la opinión de la comunidad de documentalistas, más allá de mis propias observaciones, con lo cual este correo no pretende ser una nota sino dar pie a un debate en el que los documentalistas no están teniendo voz, al desarrollarse dentro del campo de la informática.

Trabajo en generación automática de tesauros, lo cual me ha llevado a realizar experimentos de indización automática y expansión de consultas a partir de tesauros realizados a mano. Concretamente he utilizado tres tesauros: ISOC-Economía, EUROVOC y SPINES, todos ellos conocidos de sobra. La colección sobre la que he realizado las pruebas ha sido el sub-conjunto de noticias de economía y política generadas por la Agencia EFE en 1994 (efe94 es una colección típica en experimentos de recuperación de información que consta de un total de 215.738 documentos. Yo he utilizado 23.390 en mis experimentos para centrarme en el área de política y economía, las cuales son cubiertas en buena medida por los tesauros anteriormente mencionados).

A parte también he contado con un conjunto 22 de consultas con sus respectivos juicios de relevancia para el dominio mencionado de cara a la realización de los experimentos. Estas consultas las he obtenido del congreso CLEF [Cross-Language Evaluation Forum] que se celebra todo los años y que se centra en temas de recuperación de información mono y multilingüe.

Como motor de búsqueda he usado Lucene, adaptado al español con stemming sobre los términos de indización, el cual está basado en el modelo tradicional de espacio vectorial de Salton (un clásico, vamos).

El objetivo de mis primeros experimentos ha sido el de comprobar de que forma afectaba a la recuperación de información automatizada el uso de tesauros documentales como los que se usan todos los días en centros de documentación de todo el mundo. Y cual no ha sido mi sorpresa al comprobar que tanto juntos como por separado, usando todos o parte de los tipos de relaciones que existen en los tesauros, realizando expansión global directa o ponderada (la forma en que he ponderado los tesauros es otra historia), en cada uno de los casos los tesauros mencionados, no han mejorado prácticamente nada la recuperación en la colección, ni en precisión, ni en recall (ni en otro cerro de medidas que he ido aplicando basadas en el modelo propuesto por TREC [Text REtrieval Conference], otro congreso de RI que tiene un programita bastante completillo llamado trec_eval para evaluar la recuperación), es más en algunos de los experimentos, dependiendo de la longitud de la consulta el uso de tesauros documentales hechos a mano empeoraba los resultados.

El siguiente paso en mi investigación ha sido trabajar con tesauros generados automáticamente a partir de tres metodologías básicas:

Procesamiento lingüístico de la colección (POS-Tagging, análisis sintáctico, análisis de árboles de dependencia entre términos).
Análisis de co-ocurrencias para la generación de las relaciones entre términos (Latent Semantic analysis, Qui y Frei (y su versión española implementada por Zazo, Berrocal y Cia de Salamanca), Jing y Croft, etc.).
Utilización de otros recursos lingüísticos (léase eurowordnet en su versión española, y diccio).

Los tesauros generados automáticamente a partir de estas metodologías sí han proporcionado mejoras significativas en la recuperación. No me quiero poner aquí más pesado de la cuenta sobre los detalles técnicos y las cifras pero para el que las quiera se las puedo pasar.

El caso es que comenté el hecho con Antonio García Jiménez, que de esto de tesauros documentales sabe un rato, y me comentó ciertas ideas muy valiosas que explicaban en parte los resultados, y que se podrían resumir (Antonio, si andas por ahí, corrígeme si me equivoco) en que los tesauros no se adaptaban perfectamente a la colección sobre la que yo los aplicaba y que por tanto se necesitaría un tesauro hecho a mano para la colección con la que yo trabajo para obtener una mejora basada en el uso de tesauros documentales.

Tras este comentario me quede rumiando y modifique la colección para adaptarla terminológicamente a los tesauros con los que yo contaba, para hacer confluir ambos conjuntos de datos en lo posible y así comprobar si mejoraba algo la capacidad de recuperación de los tesauros, pero por desgracia los datos han seguido siendo bastante descorazonadores.

Después de todas estas pruebas me surgió la siguiente pregunta ¿realmente tienen lugar los tesauros hechos a mano, y basados en la metodología y normativas tradicionales en el panorama de recuperación automatizada imperante hoy, ya sea dentro o fuera de Internet?

Mi respuesta por el momento, y a falta de vuestros comentarios, es que no tienen lugar y que es necesario plantearse con urgencia varios cambios en la metodología de elaboración de tesauros que existe actualmente y de la que las normas ISO, el libro de Gilchrist y Aitchison y el libro de Blanca Gil, suponen las principales referencias.

Los principales problemas del uso de tesauros documentales en Recuperación de Información Automatizada son:

Dispersión de datos: Es decir en la colección aparecen constantemente palabras que el tesauro no es capaz de normalizar (este problema no se soluciona con una actualización periódica hecha a mano en función del crecimiento de la colección).
Ambigüedad Semántica excesiva aún en tesauros de dominio específico como los mencionados.
Inconsistencias en la estructura de los tesauros.

Todos estos problemas son normales teniendo en cuenta que son tesauros hechos y gestionados a mano sin ningún mecanismo más o menos automático de control de consistencia (de hecho la mera importación de los tesauros a SQL a permitido la detección de estas inconsistencias estructurales) más allá de programas tipo multites y demás.

A esto se suma que tal y como se hacen los tesauros hoy en día, y en contra de lo que muchos opinan, tampoco sirve para la transición a las ontologías, debido a cuestiones básicas de diseño (fundamentalmente el paradigma orientado a objetos) con las que los tesauros documentales no cumplen ni de lejos y que provoca serios problemas de consistencia cuando intentamos convertir un tesauro documental en una ontología.

En vista a estos hechos y a que yo no doy más de mi por el momento en este asunto, me gustaría conocer vuestra opinión en este tema (pues a muchos les va el pan en ello, pienso yo). Por concretar, las preguntas iniciales, sin excluir otras posible que podéis ir haciendo serían:

¿Cual es el papel de los tesauros documentales en el contexto de la recuperación de información automatizada en centros de documentación?
¿Cual es el papel de los tesauros documentales en la recuperación de información en Internet?
¿Es necesario modificar el paradigma de elaboración de tesauros actualmente imperante? ¿en que sentido?

Yo, aunque no soy un experto tesaurista tengo mis opiniones que iré poniendo aquí si el debate tiene éxito, pero las que me interesan son las vuestras.

Espero haber sido claro, si tenéis cualquier duda sobre lo que he escrito o algo no se entiendo no dudéis en preguntar, espero que con suerte y entre todos le podamos dar un tiento a este problema tan puramente documental."

[Fin del texto de Pérez Agüera]

Pues ya saben, cualquier comentario, rectificación, aportación etc., en relación con las cuestiones planteadas en el texto anterior, pueden enviarlo a la referida lista IWETEL, y así enriquecer el debate que sin duda merece el conjunto de asuntos planteados por Pérez Agüera en relación con la recuperación de información, la indización automatizada, y el papel que los tesauros como instrumento de descripción normalizada juegan en todo ello...

De Pérez Agüera, y sobre los temas que aborda en su comunicación a la lista IWETEL, ver también: "Automatización de Tesauros y su utilización en la Web Semántica" (SWAD-Europe, taller Introducción al uso de la Web Semántica, 13 de junio 2004). Véanse también en general los SWAD-Europe Reports y SWAD-Europe Presentations. SWAD significa Semantic Web Activity: Advanced Development. También me parece pertinente reseñar, de la revista Anales de Documentación (nº 7, 2004, págs. 79-95), el artículo de Antonio García Jiménez "Instrumentos de Representación del Conocimiento: Tesauros versus Ontologías" (en PDF).

En otro orden de cosas, aprovecho la ocasión para relacionar a continuación una serie de enlaces, referencias y textos que han ido mereciendo mi atención en los últimos meses (los entrecomillados son citas textuales tomadas de los sitios referenciados):

Artículos, introducciones, anotaciones de "blogs":

Why Use Prolog? (Jocelyn Paine). Documento en el que se exponen diez (buenas) razones para (en opinión del autor) utilizar el lenguaje de programación lógica Prolog.
"I'm sorry Dave, I'm afraid I can't do that": Linguistics, Statistics, and Natural Language Processing circa 2001 (en PDF; Lillian Lee, Cornell University).
Programación utilizando Visual Prolog 6.0 (R. Fuentes Covarrubias, Universidad de Colima, Facultad de Ingeniería Mecánica y Eléctrica, México).
The legacy of the Reverend Bayes (en Devlin's Angle, febrero 2000).
Dos muy buenas introducciones básicas al lenguaje Prolog: First Steps in Prolog: an easy introduction to this AI language / Free Prologs: a guide to freely available Prolog systems (H. Collingbourne; en Bitwise Magazine).
Linear Logic - Naturally! (en That Logic Blog): "Linear logic has enjoyed enormous popularity over the last couple of decades or so. For those without some training in structural proof theory, understanding the system can be quite intimidating, especially because of the funny notation and weird jargon. In this post, I am going to show you that, in fact, you could have invented linear logic! [...]".
Lógica, Matemática, Deducción Automática (Manuel Ojeda Aciego, Dept. Matemática Aplicada, Universidad de Málaga; en PDF): "Presentamos una breve perspectiva histórica del desarrollo en paralelo y, a veces, entrelazado, de la Lógica y las Matemáticas, con el objetivo final de presentar la Lógica Computacional y, en particular, la Deducción Automática, como un área de investigación matemática de extraordinario potencial práctico, no en balde distintos autores de conocido prestigio afirman que la Lógica es a la Computación como el Cálculo Infinitesimal es a la Física.".

Páginas y sitios web:

Neural Java: Neural Networks Tutorial with Java Applets. "Neural Java is a series of exercises and demos. Each exercise consists of a short introduction, a small demonstration program written in Java (Java Applet), and a series of questions which are intended as an invitation to play with the programs and explore the possibilities of different algorithms. [...]".
My Artificial Intelligence project.
Wikibook on Prolog ("[...] This book can serve as a textbook or tutorial for anyone who wants to learn the prolog programming language. No prior programming experience is required. Some basic knowledge of logic can come in handy. [...]").
Yandes. Conjunto de módulos concebidos para ayudar a los estudiantes de Lógica, implementados en lenguaje Prolog. Actualmente son los siguientes: TT: construcción de tablas de verdad para Lógica proposicional. Incluye además dos predicados para determinar una fórmula como válida, satisfactible, o insatisfactible, y un razonamiento como correcto o incorrecto; ND: construcción de demostraciones de deducción natural; CNF: convierte fórmulas en forma conjuntiva normal, o en forma clausal.
TRIPLE ("[...] an RDF query, inference, and transformation language for the Semantic Web. [...]").
Glosario de Recuperación de Información Web (Adriana Colino Tomé; vía Recuperación de Información en la Web).

Conferencias, congresos:

Modeling Decisions for Artificial Intelligence (Tarragona, 3-5 abril 2006): "Decision making processes, and information fusion tools at large, are currently embedded in most Artificial Intelligence applications. As a consequence, systems based on decision making and fusion techniques are becoming pervasive. They are currently in use in all kind of environments, from entertainment gadgets to safety-critical or risk management software.".
22nd International Conference on Logic Programming (ICLP 2006, 17-20 agosto 2006).

Algoritmo de aprendizaje ID3

2005-11-13T00:43:00.000+01:00

Una de las aplicaciones prácticas de las Redes Neuronales Artificiales (RNA), es la clasificación de datos, entendida ésta como un proceso de búsqueda de propiedades comunes a una serie de objetos de un dominio del conocimiento, en función de los valores de determinados atributos. Dentro de la cuestión de la clasificación automática, en tanto que proceso subsidiario de procesos más generales englobados dentro de lo que se conoce como "machine learning", uno de los algoritmos de aprendizaje automático más conocidos, basado en "ejemplos", es el denominado ID3, o "Iterative Dichotomizer (version) 3" (J.R. Quinlan, 1979). Trabaja con datos simbólicos, en contraposición a los datos numéricos, y se basa en la obtención de un árbol de decisión (ver anexo), a partir del cual se obtienen una serie de reglas de producción, capaces de representar un dominio o universo determinado, generando conocimiento independiente de dicho dominio (el sistema de aprendizaje parte de un estado inicial del dominio escogido en el que no existe conocimiento de partida, extrayendo patrones comunes de entre los ejemplos utilizados, a partir de los cuales genera una base de conocimientos de aplicación a dicho dominio). El árbol de decisión permite por tanto clasificar los datos de entrada. Se pueden distinguir dos tipos de procesos de aprendizaje:

Supervisado: los ejemplos o "explicaciones" son proporcionados al sistema por un sujeto externo. Pertenecen a esta categoría las clasificaciones de datos basadas en árboles de decisión en base a ejemplos, como es el caso del algoritmo de aprendizaje ID3.
No supervisado: los ejemplos u "observaciones" son creados por el propio sistema. Pertenecen a esta categoría los procesos de agrupamiento de datos o data clustering (o simplemente clustering).

Atendiendo a un plano de abstracción conceptual superior, en el denominado "machine learning" o aprendizaje de máquina, es posible diferenciar dos tipos de aprendizaje: aprendizaje memorístico (o aprendizaje de memoria) y aprendizaje cognoscitivo. El primero hace referencia a procesos de memorización de a) hechos y b) secuencias o procedimientos de acciones, siendo el tipo de aprendizaje más fácil de implementar en un sistema computacional "inteligente". El segundo tipo de aprendizaje, el cognoscitivo, es el que hace uso de procedimientos de razonamiento a partir de un conocimiento básico, de forma que sea posible la obtención de "descripciones de clase", generalizaciones que se obtienen de la observación de ejemplos concretos. Es por tanto un tipo de aprendizaje basado en un razonamiento de carácter inductivo, aquel que permite la formulación de principios generales, a partir de casos específicos individuales, a diferencia del razonamiento deductivo, que a partir de generalizaciones, y por medio de la lógica (silogismos), infiere conclusiones de carácter particular y concreto. En el razonamiento inductivo, es la acumulación de observaciones lo que permite llegar a conclusiones de validez universal.

No obstante, no es infrecuente, en los sistemas de aprendizaje automático, encontrar ambos universos de razonamiento, ya que las generalizaciones que se obtienen mediante el razonamiento inductivo, a partir de un grupo relativamente reducido de "ejemplos" u observaciones (fase de entrenamiento previo), servirán posteriormente para la obtención de conclusiones particulares a través de un proceso de razonamiento deductivo.

Los árboles de decisión o clasificación consisten en una técnica de carácter inductivo muy utilizada en el ámbito del aprendizaje automático. Gráficamente, están formados por nodos y ramas. Los primeros representan el identificador de un atributo concreto. Los nodos terminales u hojas representan los valores asociados a dicho atributo, mientras que las ramas. A cada uno de estos valores, se accede a través de una rama que parte del nodo en cuestión. Los casos son dirigidos hacia una u otra rama en función de los valores de sus atributos. Los árboles de clasificación son un método de aprendizaje válido en aquellas situaciones en las cuales los ejemplos de partida se pueden representar mediante un conjunto finito de atributos y valores. Los árboles de clasificación también se pueden concebir, desde un punto de vista algorítmico, como un conjunto de reglas if-then.

El carácter de los árboles de decisión es jerárquico, por lo que solo son capaces de representar conocimiento jerárquico, la mayor parte del mismo. Por otro lado, su construcción tienen un carácter recursivo y descendente, de los conceptos generales a los particulares, razón por la cual el acrónimo TDIDT (Top-Down Induction on Decision Trees) es utilizado para referirse a los algoritmos de construcción de árboles de decisión, como es el caso del algoritmo ID3 de Quinlan.

La mayoría de las heurísticas utilizadas para la determinación de árboles de decisión mediante algoritmos de aprendizaje, se basan en la teoría matemática de la información (C. Shannon, W. Weaver; Bell Laboratories, 1948) [1] [2]. Las heurísticas son criterios, métodos o principios, que permiten decidir, de entre varias alternativas de acción, cuál será la más efectiva para cumplir determinada meta. Permiten restringir el número de evaluaciones, y en consecuencia repercuten en una mejora de los tiempos de búsqueda de soluciones. Entropía y cantidad de información son dos conceptos que se dan la mano en el campo de las heurísticas. Sobre Entropía y cantidad de información, ver en Tio Petros: [1] [2] [3] [4].

El algoritmo ID3 genera lo que se conoce como reglas "duras", es decir, aquellas que solo atienden a dos posibles estados (verdadero-falso, positivo-negativo, 0-1, etc.), y que tienen por tanto un carácter bivalente, a diferencia de las reglas "borrosas", que permiten representar un rango infinito de valores entre dos extremos de una escala, como las que se obtienen mediante algoritmos ID3 "extendidos" (ID4, ID5, ID5R, C4.5, C5, etc.).

Pseudocódigo del algoritmo ID3:

Si todos los ejemplos de E pertenecen a una misma clase C, entonces
   arbol1 <-- nodo etiquetado con C
SiNo
   Si a = f, entonces
      C <-- clase mayoritaria de los ejemplos de E
      arbol1 <-- nodo etiquetado con C
   SiNo
      A <-- mejor atributo de a
      arbol1 <-- nodo etiquetado con A
      Para cada v perteneciente a los valores de A, hacer
         EAv <-- los ejemplos de E que tienen el valor v para el atributo A
         Si EAv = f, entonces
            arbol2 <-- nodo etiquetado con la clase mayoritaria en E
         SiNo
            arbol2 <-- ID3(EAv , a-{A})
         arbol1 <-- añadir a arbol1 el arbol2, a través de una rama etiquetada con v
Devolver arbol1

Otra representación en pseudocódigo del algoritmo ID3:

Aprendizaje-Árbol-Decisión(Ejemplos, Atributos, Default)
   retorna un árbol de decisión

IF no hay Ejemplos, retornar Default
ELSE IF si todos los Ejemplos tienen la misma clasificación,
   retornar la clasificación,
ELSE IF Atributos = vacío, retornar Mayoría(Ejemplos)
ELSE
   mejor-atr <-- elegir-atributo(Atributos, Ejemplos)
   árbol <-- nuevo árbol de decisión con raíz en mejor-atr
   FOR EACH valor v[i] de mejor-atr DO
      Ejemplos[i] <-- {elementos de Ejemplos con mejor-atr = v[i]}
      subar <-- Aprendizaje-Árbol-Decisión(ejemplos[i], Atributos - mejor-atr, Mayoría(Ejemplos))
      agregar rama al árbol con etiqueta v[i] y subárbol subar
   OD
retornar árbol

Los procesos de aprendizaje, que hacen uso de la clasificación de datos, mediante el descubrimiento de patrones, se utilizan con profusión dentro de lo que se conoce como "Data Mining", en castellano minería de datos, explotación de datos, o descubrimiento de conocimiento en bases de datos, diversidad terminológica en torno a la cual existe una cierta polémica.

Maximiliano del Rio es autor de una versión escrita en lenguaje Prolog del algoritmo de aprendizaje ID3. Los archivos correspondientes a esta implementación (librería Clasif) se pueden localizar bien en la sección de código fuente de programacion.com (comprimidos en un "zip"), o en el espacio personal que el propio autor tiene en el "Wiki" de SWI-Prolog. En "guia.txt" se explica el manejo de esta implementación del algoritmo ID3 en Prolog, que hace uso de la interfaz ODBC para consultar las tablas de la base de datos seleccionada, de las que se obtienen los ejemplos necesarios para generar las reglas de producción. Se adjunta además el archivo "clasif.pl", programa de "Data Mining" que hace uso del algoritmo ID3, dotado de interfaz gráfica mediante la utilización de la librería nativa XPCE.

"[...] programa que utiliza la librería anterior [...] Ayuda a generar las reglas y muestra las reglas obtenidas textual y gráficamente; también muestra una traza de como trabaja el algoritmo."
Fuente

Esta interfaz gráfica se abre lanzando el objetivo "?- main." en la línea de órdenes de SWI-Prolog, una vez compilado el programa. Finalmente, la librería "compila.pl" contiene predicados que permiten generar un ejecutable para Windows de los resultados obtenidos, mediante SWI-Prolog.

Para obtener una visión bastante amplia sobre la implementación en lenguaje Prolog de procesos de aprendizaje automático en general, y aprendizaje inductivo mediante árboles de decisión en particular (clasificación de datos), es muy recomendable la lectura del capítulo 18, "Machine Learning", de la (ya clásica) obra de Ivan Bratko "Prolog: Programming for Artificial Intelligence" (2ª ed. Addison-Wesley, 1994; ISBN: 0-201-41606-9). Sobre árboles de decisión trata concretamente el punto 18.6, "Induction of decision trees".

Existe así mismo un repositorio de algoritmos de aprendizaje automático escritos en lenguaje Prolog, Prolog library of machine learning algorithms, un tanto desactualizado eso sí, ya que la última actualización parece datar del año 1994, mantenido por Thomas Hoppe (Fraunhofer-Gesellschaft, Universidad Técnica de Berlín). Los programas están escritos haciendo uso de la sintaxis y, en la mayor parte de las ocasiones, de los predicados predefinidos (built-in predicates) contemplados en el Prolog descrito por Clocksin y Mellish, conocido como "estándar de Edimburgo", basado a su vez en el DECsystem-10 (D. Warren, F. Pereira y L. Pereira), para de esta forma asegurar el mayor grado posible de compatibilidad entre versiones de este lenguaje. Las implementaciones del algoritmo ID3 se localizan en la carpeta "IDT" (ver en cualquier caso el archivo "Readme" para más información).

Más información:

Algoritmo ID3 de J.R. Quinlan (documento traducido por J.A. Fernández, en PDF, comprimido en un zip).
Aspectos Básicos del Aprendizaje Simbólico (J.G. Boticario).
Aprendizaje de clasificadores (F. Berzal Galiano; en PDF).
ART: Un método alternativo para la construcción de árboles de decisión (F. Berzal Galiano; en PDF).
ART: Un método alternativo para la construcción de árboles de decisión (F. Berzal Galiano, 2002; tesis doctoral, en PDF).
IDT: Torgos ID3-like system based on the gain-ratio measure (algoritmo ID3 escrito en sintaxis del Prolog de Edimburgo). Este código se localiza en el directorio sobre Machine Learning del CMU Artificial Intelligence Repository (ver descripción; en cada uno de los directorios existen tres archivos, "0.html", "0.doc" y "readme.txt", que contienen la descripción de su contenido). El directorio dedicado al lenguaje Prolog en general se localiza en este enlace.
Induction of Decision Trees.
Árboles, Grafos (en Estructuras de Datos, algoritmia.net).
Árboles de Clasificación (PDF; tema de los apuntes de la asignatura "Métodos Matemáticos en Ciencias de la Computación", UPV).
Sistemas de Inducción de árboles de decisión.
Decision Tree for Optimization Software.
En Artificial Intelligence Lecture Notes: a) Problem Solving in Prolog; b) Induction of Decision Trees.
Algoritmo ID3 escrito en Prolog.
"ID3" en "The Machine Learning Dictionary".
"IDT: Torgos ID3-like system based on the gain-ratio measure" en CMU Artificial Intelligence Repository. Forma parte del directorio de programas "Machine Learning Algorithms Implemented in Prolog".
Tesis doctoral: Inducción de Conocimiento con Incertidumbre en Bases de Datos Relacionales Borrosas (A. J. Gómez Flechoso, 1998). En relación con los temas tratados en este "post", ver el capítulo 2 en general, y en particular los apartados 2.1 (Introducción), 2.2 (Descubrimiento de conocimiento y minería de datos), 2.3 (Métodos aplicados de minería de datos), y 2.4 (Programación Lógica Inductiva).
MLnet (Machine Learning network) Online Information Service.

Anexo - Árboles de decisión

Los árboles de decisión son una representación de los procesos involucrados en las tareas de clasificación. Se componen de:

Nodos: nombres o identificadores de los atributos.
Ramas: posibles valores del atributo asociado al nodo.
Hojas: conjuntos ya clasificados de ejemplos y etiquetados con el nombre de una clase.

Los nodos reflejan propiedades de los objetos del dominio, los arcos o ramas son los distintos valores de dichos atributos y las hojas son las clasificaciones posibles.

[Los árboles de decisión] Se adaptan especialmente bien a aquellos casos en los que:

Los ejemplos pueden ser descritos como pares valor-atributo.
La función objetivo toma valores discretos.
Podemos tomar hipótesis con disyunciones.
Posible existencia de ruido en el conjunto de entrenamiento.
Los valores de algunos atributos en los ejemplos del conjunto de entrenamiento pueden ser desconocidos.

[Fuente: Inducción de Árboles de Decisión: extensiones del ID3] [Volver al texto]

Técnicas mnemotécnicas y acertijos de ingenio

2005-11-11T14:09:00.000+01:00

Nota: la primera parte de esta extensa anotación, la más directamente relacionada con el enunciado del título, ya fue publicada en mi bitácora hermana, Visto y Leído, el 16/01/2004, bajo el mismo título. Al apuntar posteriormente algún enlace en el que se trata de la aplicación de la programación lógica en general, y Prolog en particular, a los acertijos de ingenio y los juegos lógicos, he ido añadiendo otras cuestiones estrictamente relacionadas con dicho lenguaje de programación, particularmente relativas a su origen, evolución y algunas de sus versiones desarrolladas a lo largo del tiempo con más o menos fortuna y permanencia posterior.

En el libro "Ayudando a la memoria. Técnicas y trucos para recordar" (Plaza & Janes, 2001; ISBN: 84-8450-527-8) su autor, Josep Mª Albaigès, incluye, como complemento imprescindible a la excelente descripción que se aborda en el libro respecto de los procesos de retención, memoria, y técnicas de recuperación o recuerdo de lo memorizado, un curioso "Diccionario de Mnemotecnias", en el que se recogen, ordenados alfabéticamente en relación con la cuestión a la que hacen referencia, toda clase de recursos mnemotécnicos (de mnemo + tecnia, aquellos que sirven para auxiliar a la memoria), algunos de cierta complejidad y otros más asequibles, referidos a aspectos muy variados. En este mismo diccionario se encuentra la siguiente definición:

"Llamamos mnemotecnia a cualquier truco o procedimiento abreviado que permite recordar, de forma más o menos provisional, una cosa concreta y en general breve."

En "Ayudando a la memoria...", página 95

Me quedo para esta ocasión con dos curiosidades referidas al universo de las clasificaciones, entendidas éstas en sentido amplio (cito textualmente):

Clasificación decimal en bibliotecas
Las temáticas de la clasificación decimal suelen ser: 0. Obras Generales - 1. Filosofía - 2. Religión - 3. Ciencias Sociales - 4. Lengua - 5. Ciencias Puras - 6. Tecnología - 7. Arte - 8. Literatura - 9. Historia. Que se recuerdan con la frase: "Generales: ¡filosofad religiosamente! Socios: ¡hablad puramente! Técnicos y artistas: ¡escribid históricamente!".

Taxonomía
La clasificación de las especies naturales comprende los siguientes escalones: Reino - Tipo - Clase - Orden - Familia - Género - Especie. Se recuerda esta secuencia, en orden inverso, con la frase: "Una especie general de familias ordenadas clasifican los tipos del reino".

Es también muy curiosa la descripción menotécnica de los silogismos (y la forma de recordar las figuras en que los escolásticos los clasificaron), del número pi, y de varios principios o teoremas fundamentales de la física y la estadística, entre otros, pero dada la relativamente amplia extensión de los textos en cuestión, me remito a la consulta y lectura del libro referenciado, caso de interesar este tema.

La lógica silogística o aristotélica trata de determinar la verdad o falsedad de determinado argumento filosófico, mediante el contraste de proposiciones o premisas, y en cierto sentido puede ser considerada como una formalización, basada en expresiones del lenguaje natural, del sentido común. La utilización del silogismo por parte de los escolásticos se entiende dada la integración de la filosofía de Aristóteles en la dogmática cristiana, característica de la tarea de reflexión desarrollada por este grupo de pensadores de la Filosofía occidental entre mediados del siglo XI y mediados del siglo XV, aproximadamente.

Josep Mª Albaigès es también editor de la revista Carrollia,

"[...] órgano de comunicación [...] de Mensa España, que se dedica a las Matemáticas recreativas, la Lingüística, la Literatura Experimental, la Lógica, la Ciencia y todo aquello que hubiera gustado a Lewis Carroll."

Fuente

Los boletines de los últimos años están disponibles en formato PDF. También es muy recomendable, si se está interesado por estos temas, la "Colección de juegos de ingenio" (resueltos) del Club Mensa, gran parte de ellos editados originalmente en las páginas de Carrollia. En otro orden de "utilidad" práctica, el "Boletín Oficial de la Facultad de Ciencias Inútiles" (BOFCI) es otra publicación del Club Mensa cuya lectura conviene no perderse...

Y ya que hablamos, al menos tangencialmente, de juegos lógicos y de ingenio, mencionar dos bitácoras en lengua castellana dedicadas de forma monográfica a estos asuntos: Juegos de Ingenio & Acertijos y Pequeños Enigmas. En este último sitio se localizan un buen número de enlaces que llevan a otras páginas de temática afín (ver el apartado "Buenas páginas de ingenio").

Enlazando la cuestión planteada inicialmente con la utilización de la programación lógica en general, y el lenguaje Prolog en particular, en la resolución de acertijos y juegos lógicos, podemos mencionar a modo de ejemplo el excelente trabajo "Resolviendo acertijos con Prolog" (J. Peri, Universidad Nacional de Luján, Argentina; en formato PostScript), en el que podemos leer:

"[...] Prolog puede ser imaginado como un laboratorio de lógica. Su capacidad para manejar expresiones simbólicas le permite codificar fácilmente cierto tipo de información que en los lenguajes procedurales es muy difícil de manejar. La programación lógica permite traducir en líneas de código descripciones de hechos e implicaciones, lo que en principio permite codificar líneas de razonamiento completas."

En "Resolviendo acertijos con Prolog"

Los ejemplos están escritos en notación Micro-Prolog, que difiere sustancialmente de la difundida posteriormente como estándar de facto por el denominado "Prolog de Edimburgo", tal y como se explica en un apéndice al final del documento (Apéndice II - Diferencias entre Micro-Prolog y la notación de Edimburgo), si bien la semántica de ejecución es idéntica en ambos casos. La lógica subyacente en los ejemplos expuestos es en cualquier caso plenamente válida, independientemente de la notación con la que se representen.

El autor de este trabajo es coordinador del "Grupo de Programación Funcional y Lógica" (UNL, UNP, Argentina), cuyos miembros han publicado también otros interesantes documentos y trabajos sobre diversos aspectos de la programación lógica, localizables en la página web de dicho grupo (tengan paciencia con las descargas, el servidor es bastante lento, y se demoran un cierto tiempo). La utilización de la notación de Micro-Prolog en los trabajos de este grupo, se explica en razón de que sus miembros han desarrollado un intérprete para Prolog, Edulog, orientado hacia fines educativos y la utilización en sus cursos y seminarios, que precisamente hace uso de la notación que venimos comentando. El proyecto parece estar paralizado, al menos en su forma de comunicación pública, ya que las páginas llevan bastante tiempo sin ser actualizadas. El prototipo Edulog es accesible desde un enlace ubicado en la página de la asignatura "Programación Funcional y Lógica", si bien el archivo de descarga está protegido por contraseña. Supongo que poniéndose en contacto con los responsables del proyecto, y exponiéndoles las razones por las que se quiere acceder a su uso, no habrá ningún problema en conseguir la clave correspondiente.

La notación implementada por Micro-Prolog es más limitada y menos flexible que la propia del estándar de Edimburgo: así por ejemplo, los posibles nombres de variables están muy restringidos, y el intérprete se conformará con la primera solución que satisfaga el objetivo planteado, en contraposición a lo habitual en los intérpretes actuales basados en el Prolog estándar, que es tratar de proporcionar todas las posibles soluciones hasta agotar la base de conocimientos del programa y las posibilidades de unificación de las variables en juego. Otras diferencias se refieren a la utilización, por parte de Micro-Prolog, de predicados predefinidos de carácter particular.

Las diferencias básicas entre ambos tipos de notaciones están perfectamente explicadas, con ejemplos, en el documento "Diferencias entre la notación de Micro Prolog y la de Edimburgo" que encontramos en la página de la asignatura mencionada, si bien el archivo comprimido que sirve como medio de descarga al original en formato Word, está también protegido por contraseña, por lo que de nuevo se hace necesario ponerse en contacto con sus autores con el fin de obtener la pertinente autorización.

Micro-Prolog fue un dialecto del lenguaje Prolog creado alrededor de 1980 para ser ejecutado originalmente en los primeros ordenadores personales, equipos de poca capacidad de procesamiento y memoria en comparación con los parámetros actuales, basados en el procesador Z-80 de Zilog Corp., sucesor del 8085 de Intel, y el S.O. CP/M, antecesor del PC/MS-DOS (ZX Spectrum, Commodore 64, etc.). El compilador e intérprete LPA Prolog Professional soporta la notación Micro-Prolog, aunque hay que advertir que se trata de un "dialecto" completamente en desuso, dadas sus evidentes limitaciones, siendo la notación del estándar de Edimburgo (también conocida como sintaxis DECsystem-10) la más extendida, y por tanto la empleada en la práctica totalidad de las implementaciones actuales de intérpretes para el lenguaje Prolog. Desde este otro enlace se puede descargar el intérprete original para Micro-Prolog.

W.F. Clocksin y C.S. Mellish, en su libro "Programación en Prolog" (Gustavo Gili, 1993; ISBN: 84-252-1339-8), dedican un apartado completo, "Apéndice E - Micro-Prolog", a la explicación de la sintaxis implementada por Micro-Prolog:

"La sintaxis de Micro-Prolog es bastante diferente [...] La idea básica es que sólo existe un tipo de término: la lista. Si queremos construir el «término» con funtor f y cuatro argumentos, usamos de hecho una lista de cinco elementos, con f como la cabeza, y los cuatro argumentos apareciendo sucesivamente como los elementos restantes. Así, lo que en la sintaxis de nuestro «núcleo» se escribiría: f(a,g(2,3),c) se escribiría en Micro-Prolog: (f (g 2 3) c). Aquí también vemos la sintaxis diferente para listas, en donde las listas van entre paréntesis, con sus elementos separados por espacios.

Las cláusulas se representan como listas de términos, en los que el primero es la cabeza de la cláusula, y el resto son objetivos, que tomados como una conjunción, forman el cuerpo. He aquí una cláusula más complicada [...]:

((alterar (z1|z2) (x|y))
(cambiar z1 x)
(altera z2 y)
)

Esto es la segunda cláusula de [el predicado] alterar de la sección 3.4. [...]

alterar([H|T],[X|Y]):- cambiar(H,X), alterar(T,Y).

[...] Los nombres y propósitos de los predicados predefinidos varían considerablemente de los que se han visto a lo largo de este libro [...]"

En Programación en Prolog, Apéndice E - Micro-Prolog

Por otra parte, en Turbo Prolog los programas se dividen en secciones diferenciadas: dominios, cláusulas, predicados, base de datos y objetivos. La explicación, tanto sobre la sintaxis de Micro-Prolog, como sobre otros aspectos generales de este dialecto (predicados predefinidos particulares, facilidades para la depuración del código, etc.), tiene cierta extensión, por lo que me remito a la obra referenciada para obtener más información al respecto, y en particular, además de al referido Apéndice E, a los apéndices "C - Diferentes versiones de Prolog" (ofrece una breve visión general sobre este particular), y "D - Prolog del DECsystem-10".

Peter Van Roy (Universidad Católica de Lovaina, Bélgica, Dpto. de Ingeniería Informática), una de las figuras más destacadas en el mundo de la programación lógica, es autor de un artículo, de lectura más que recomendable, referido a la evolución del lenguaje Prolog en la década que transcurre a partir de la aparición de la arquitectura WAM: "1983-1993: The Wonder Years of Sequential Prolog Implementation" (en formato PS):

"This report surveys the major developments in sequential Prolog implementation during the period 1983-1993. In this decade, implementation technology has matured to such a degree that Prolog has left the university and become useful in industry. The survey is divided into four parts. The first part gives an overview of the important technical developments starting with the Warren Abstract Machine (WAM). The second part presents the history and the contributions of the major software and hardware systems. The third part charts the evolution of Prolog performance since Warren?s DEC-10 compiler. The fourth part extrapolates current trends regarding the evolution of sequential logic languages, their implementation, and their role in the marketplace."

"By 1983 Warren had developed the WAM, a structure-copying execution model for Prolog that has become the de facto standard implementation technique [...]. The WAM defines a high-level instruction set that maps closely to Prolog source code. [...]"

En "1983-1993: The Wonder Years of Sequential Prolog Implementation"

La tesis doctoral de Peter Van Roy versaba precisamente sobre la implementación de la WAM: "Can Logic Programming Execute as Fast as Imperative Pro-gramming?" (PhD Thesis, Department of Computer Science, U.C. Berkeley, Report UCB/CSD 90/600, 1990).

La aparición de la Máquina Abstracta de Warren o WAM (David H.D. Warren, 1983) supuso un punto de inflexión en la evolución del lenguaje Prolog, por cuanto comportaba la definición de un conjunto de instrucciones de alto nivel y un modelo de ejecución para este lenguaje, y la materialización de la programación lógica con restricciones (Constraint Logic Programming, CLP). Supone la base, adoptada como estándar de facto, para la implementación de intérpretes portables para el lenguaje Prolog, convirtiéndolo en un lenguaje multipropósito con características similares a las de los lenguajes compilados de carácter procedimental, en lo que alos tiempos de ejecución se refiere. Así, en el sitio web del intérprete SWI-Prolog leemos:

"SWI-Prolog is a Prolog implementation based on a subset of the WAM (Warren Abstract Machine)."

"[...] is based on a very restricted form of the WAM [...] described in Bowen & Byrd, 1983 which defines only 7 instructions. Prolog can easily be compiled into this language and the abstract machine code is easily decompiled back into Prolog. As it is also possible to wire a standard 4-port debugger in the WAM interpreter there is no need for a distinction between compiled and interpreted code. Besides simplifying the design of the Prolog system itself this approach has advantages for program development: the compiler is simple and fast, the user does not have to decide in advance whether debugging is required and the system only runs slightly slower when in debug mode. The price we have to pay is some performance degradation (taking out the debugger from the WAM interpreter improves performance by about 20%) and somewhat additional memory usage to help the decompiler and debugger."

"SWI-Prolog extends the minimal set of instructions described in Bowen & Byrd, 1983 to improve performance. While extending this set care has been taken to maintain the advantages of decompilation and tracing of compiled code. The extensions include specialised instructions for unification, predicate invocation, some frequently used built-in predicates, arithmetic, and control (;/2, |/2), if-then (->/2) and negation-by-failure (\+/1)."

En SWI-Prolog Reference Manual - 1.1 SWI-Prolog

La función de esta máquina virtual, dentro del núcleo del intérprete, es compilar las instrucciones escritas en lenguaje de alto nivel a instrucciones en lenguaje máquina, de forma similar a como lo hace la máquina virtual Java (JVM). La arquitectura WAM ha permitido en consecuencia desarrollar versiones de Prolog "compilado" a nivel de ejecución, aun cuando los programas se sigan guardando y ejecutando desde archivos que contienen código escrito en lenguaje de alto nivel. De manera general, una máquina virtual es por tanto un procedimiento abstracto para ejecutar conjuntos de instrucciones escritas en un lenguaje formal, como puede ser en este caso Prolog.

"[...] si utilizamos un entorno de programación interpretado de Prolog [...] la eficiencia, en cuanto a velocidad de ejecución se refiere, disminuye, al igual que en cualquier lenguaje interpretado, frente a un lenguaje compilado.

El conjunto de instrucciones de las computadoras actuales resulta muy pobre en relación con la semántica de Prolog, por lo que la mayoría de los compiladores de Prolog [...] realizan una compilación a un lenguaje intermedio en vez de hacerlo directamente a lenguaje máquina. El lenguaje más popular es el Warren Abstract Machine (WAM) [...] conjunto de instrucciones abstractas utilizable en Prolog y que se puede interpretar o traducir a lenguaje máquina. Existen otros compiladores que traducen Prolog a un lenguaje de alto nivel como Lisp o C, y utilizan dicho compilador para traducir a lenguaje máquina.

Antes del trabajo de Warren sobre la compilación de la inferencia en Prolog, la programación lógica resultaba excesivamente lenta para su uso generalizado. Los compiladores diseñados por Warren y otros permitieron a Prolog alcanzar velocidades adecuadas [...] En fechas más recientes, la aplicación de la moderna tecnología de compilación [...] ha permitido a Prolog alcanzar velocidades tan óptimas que lo hace competir con C en cuanto a diversos aspectos estándar [...]. [...] el hecho de poder escribir un planificador o un analizador de lenguaje natural en unas cuantas decenas de líneas de Prolog, hacen que éste sea más preferible que C en la realización de los prototipos de gran parte de los proyectos de investigación de IA a escala reducida."

Fuente (estructura general de marcos de la página citada)

Más información al respecto: "Warrens's Abstract Machine: A Tutorial Reconstruction" (en PDF; Hassan Aït-Kaci; The MIT Press, Cambridge, MA, 1991).

En el siguiente trabajo se describe el sistema y la notación DECsystem-10 Prolog, en la que se basa el estándar de Edimburgo, que recordemos es de facto el sistema Prolog estándar en la actualidad, recogido la norma ISO vigente referida a este lenguaje (ISO/IEC 13211-1:1995 Part 1: General core):

"DECsystem-10 Prolog User's Manual". D.L. Bowen (ed.), L. Byrd, F.C.N. Pereira, L.M. Pereira, and D.H.D. Warren, Department of Artificial Intelligence, University of Edinburgh, November 10, 1982.

Si bien el formato del anterior documento es ".doc", se trata realmente de un archivo de texto plano, por lo que se descoloca la disposición del mismo si se abre con MS Word. También: versión en HTML, y traducción al castellano de este manual, limitada a los tres primeros capítulos.

El DECsystem-10 Prolog fue una implementación creada y desarrollada (1977, 1980) por D. Warren y otros (F. Pereira, L. Byrd, L. Pereira) en el Departamento de Inteligencia Artificial de la Universidad de Edimburgo, para operar en sistemas informáticos DECsystem-10. Junto con el Prolog descrito en la obra referenciada de Clocksin y Mellish, las versiones del DEC-10 Prolog y sus posteriores desarrollos constituyen la base del estándar o sintaxis de Edimburgo.

Las iniciales DECsystem-10 hacen referencia al sistema informático sobre el que se basó la implementación Prolog de la Universidad de Edimburgo que venimos comentando, fabricado por Digital Equipment Corp. Los DECsystem-10/20 eran sistemas de arquitectura de 36-bit, cuyas primeras versiones datan del año 1971. Cuando hablamos de este tipo de sistemas no hay que pensar en los PCs, posteriores en el tiempo y orientados inicialmente hacia otro tipo de usuario final, sino que se trataba de equipos situados, por potencia de procesamiento y cálculo (y todo sea dicho, por dificultad de manejo y operación), en la escala de los grandes equipos informáticos conocidos como "mainframes". No es infrecuente encontrar, en guías y manuales antiguos del lenguaje Prolog (por ejemplo los referidos a C-Prolog [en HTML] [en PS], y en general a las implementaciones derivadas de la primera especificación DECsystem-10 Prolog), referencias a TOPS-20, evolución de los DECsystem-10/20, y a otros sistemas de DEC.

Sobre la base de este primer intérprete-compilador para Prolog se creó, en 1983, uno de los primeros intérpretes puros para dicho lenguaje, C-Prolog (F. Pereira, D. Bowen, L. Byrd), escrito en lenguaje C, que contribuyó a consolidar el estándar de Edimburgo, como referencia para posteriores implementaciones.

Para finalizar esta anotación, mencionar el ejemplo de aplicación práctica del lenguaje Prolog a la resolución de juegos y acertijos lógicos descrito en "Solving Rubik's Cube Using the Bestfast Algorithm and Profile tables - A Prolog program and demonstration of an efficient heuristic search method" (por D.L. Winston Miller). Como el propio título indica, en este texto se explica el fundamento teórico y el funcionamiento de un programa diseñado para efectuar la búsqueda de los mejores métodos posibles de resolución del problema planteado por el famoso Cubo de Rubik. Los archivos que conforman el programa (ver al final del documento) están escritos originalmente para ser ejecutados bajo el intérprete Arity Prolog (de uso libre) si bien, al soportar la notación y predicados del estándar de Edimburgo, el programa en principio debería también poder ejecutarse correctamente bajo SWI-Prolog.

El programa hace uso de un algoritmo de búsqueda A* (ejemplo), basado en el tipo conocido como "best-first search", derivado a su vez del método de búsqueda "breadth-first search" o "búsqueda primero en anchura" (ejemplo), que evalúa cada nodo del mismo nivel, dentro del árbol de búsqueda (entendiendo por tal la representación en forma de grafo dirigido -los nodos que lo forman están conectados mediante flechas que indican la dirección del movimiento- de un determinado problema de búsqueda), antes de continuar el proceso en el siguiente nivel de profundidad. En contraposición a este método se sitúa la búsqueda "depth-first" o "primero en profundidad" (ejemplo), en la que se explora cada "rama" del árbol hasta llegar al "nodo terminal", antes de proceder a la búsqueda por otro camino. Este es precisamente el tipo de búsqueda "interna" por defecto que lleva a cabo el lenguaje Prolog (búsqueda en profundidad y de izquierda a derecha en un árbol And-Or) dentro de la base de conocimientos compilada, al tratar de satisfacer los objetivos.

"The A* [...] is an efficient and widely used pathing algorithm. The A* keeps track of the cost of getting from point A to point B and the overall cost of getting from the beginning point to the end point. The algorithm follows the path of least cost to find a solution. The A* uses up a lot of memory and can be very slow on rough terrain - therefore it is not used for real-time robotics pathing too often."

Fuente

A los dos tipos básicos de algoritmos de búsqueda mencionados (existen otros muchos), se les pueden añadir eventualmente métodos heurísticos de evaluación, consistentes en reglas capaces de valorar si, en base a determinado tipo de información previa, la búsqueda está siguiendo el camino correcto, para de esta forma aumentar la probabilidad de dar con la solución correcta. Los métodos heurísticos tratan de aplicar dos criterios de búsqueda: a) elección de los caminos que es posible que fallen con mayor probabilidad, para de esta forma "podar" el espacio de búsqueda y así reducir su tamaño, o bien b) comprobación, en primer lugar, de los caminos con mayor probabilidad de éxito. Las búsquedas heurísticas son por tanto búsquedas basadas en la experiencia. La adición de capacidades heurísticas a los métodos de búsqueda "breadth-first", da lugar a los algoritmos "best-first search", como el A* utilizado en el programa aplicado a la resolución de los estados del Cubo de Rubik.

Estos tres tipos básicos de algoritmos de búsqueda, así como los conceptos y teoremas básicos de la Teoría de Grafos [1] [2] [3] necesarios para la comprensión y conocimiento de sus mecanismos de funcionamiento, se describen ampliamente en los capítulos 11. "Basic Problem-Solving Strategies", 12. "Best First: A Heuristic Search Principle", y 13. "Problem Reduction and AND/OR Graphs" de la obra de Ivan Bratko "Prolog programming for Artificial Intelligence" (Addison-Wesley, 1994; ISBN: 0-201-41606-9).

Por otra parte "Artificial Intelligence Through Search" (C.J. Thorton, B. du Boulay) es un libro que aborda de forma especifica la cuestión de los métodos y algoritmos utilizados en espacios de búsqueda (definidos éstos por el conjunto de todos los nodos de un grafo dirigido). Desafortunadamente, en la versión electrónica de este libro se pierden gran parte de las figuras y esquemas del original impreso, lo cual dificulta la comprensión de estas cuestiones, que de por si tienen cierta complejidad.

Más información:

"Los Juegos como Herramienta Docente. Formalización de Juegos Lógicos en Prolog" (F. Llorens, Mª Jesús Castel, F. Mora y C. Villagrá; en PDF).
Turbo Prolog.
Early History of Prolog: The birth of Prolog / La naissance de Prolog (en PDF; P. Roussel).
Notas de curso sobre Prolog: Chapter 7 Graphs (representación de grafos en Prolog).
Código fuente de algunos algoritmos A*.
Otro ejemplo de implementación del algoritmo de búsqueda A* en Prolog, y en dos versiones: a) en sintáxis Turbo Prolog, compatible con Visual Prolog + IDA* (Iterative Deepening A* search); y b) en sintáxis LPA Win-Prolog.
The A* algorithm in Prolog (en Prolog Tutorial de J.R.Fisher).
A* for the Masses (en generation5.org).

Selección de enlaces

2005-07-20T12:29:00.000+02:00

Siguiendo con la práctica introducida meses atrás en este sitio, a continuación reseño una serie artículos, anotaciones, y enlaces diversos, recopilados en las últimas semanas (los entrecomillados son citas textuales tomadas de los sitios referenciados):

Artículos, introducciones, anotaciones de "blogs":

Searching for Logic (en Logic and Language). Esta anotación versa sobre la aplicación de las leyes de la lógica al ámbito de las búsquedas en los catálogos de bibliotecas.
Algunas Experiencias en la Utilización de Sistemas de EAC para la Enseñanza de la Inteligencia Artificial (PDF; M. Lezcano, V. Giraldo Valdés; en Divulgaciones Matemáticas, vol. 6 nº. 2, 1998). EAC = Enseñanza Asistida por Computadora (en inglés CAI, Computer Aided Instruction, o bien Computer-assisted Instruction).
Practical Common Lisp (acerca del libro de Peter Seibel; en Slashdot).
Lingüística y ciencia ficción (por Xavier Riesco Riquelme, en El archivo de Nessus). "El único género literario que se ha ocupado de la lingüística como tal de forma constante, al menos en los últimos años, es que se sepa, el conocido como ciencia ficción. No sólo desde el punto de vista temático de una novela, sino también desde el punto de vista de la crítica literaria y el ensayo. Normalmente muchos libros del género contienen elementos lingüísticos como subsidiarios a la idea central. [...]".
An AI tool for the real world - Knowledge modeling with Protégé (H. Knublauch; en JavaWorld, junio 2003): "While artificial intelligence (AI) is often regarded as an exotic academic playground, its tools and techniques have matured to contribute to real-world software technology as well. This article introduces Protégé, arguably the most successful open source knowledge-modeling platform. Using Protégé, developers and domain experts can build conceptual models and knowledge bases and access them via an easy-to-use Java API. The resulting models can implement decision-support systems, capture software requirements, populate databases, generate Java classes and UML diagrams, share and reuse domain models, and access the Semantic Web.".
Falacias y errores de lógica. "[...] Hay una cierta cantidad de errores que uno debe evitar al construir argumentos deductivos. Algunos son errores formales de lógica [...] otros representan errores de concepto o actitudes inaceptables. Se conocen como falacias; de un argumento que resulta invalidado por una falacia se dice que es "falaz". [...]".
Estructuras de Datos y Algoritmos en Java (J. Friesen, traducido por J. A. Palos; en Java en castellano).
Una introducción a los Sistemas Expertos (en Vida Artificial). Este artículo incluye una descripción de SIE (Simple Inference Engine), motor de inferencia que permite desarrollar pequeños sistemas expertos, utilizando el lenguaje XML para almacenar la base de conocimientos.
Primer on vagueness (S. Shapiro; vía LogBlog): "[...] primer on the philosophical and logical issues concerning vagueness. [...]".
Entropía y cantidad de información: [1] [2] [3] [4] ("[...] Nuestro propósito es definir dos conceptos relativos a las variables aleatorias: cantidad de información y entropía. [...]"; en Tio Petros).

Páginas y sitios web:

blogic, an interactive introduction to logic (J. David Velleman). "[...] blogic is an interactive web-based textbook in introductory logic. The textbook includes interactive exercises that automatically correct the student's work. [...]".
Thea: A Web Ontology Language - OWL Parser for [SWI] Prolog: "Thea is a Prolog implementation of an OWL parser. [...] uses SWI-Prolog?s Semantic Web library for parsing RDF/XML serialisations of OWL documents into RDF triples and then it builds a representation of the OWL ontology as it is defined in the OWL Web Ontology Language Semantics and Abstract Syntax part of the OWL specification. The OWL ontology abstract syntax is implemented as Prolog terms."
ACM Transactions on Computational Logic (TOCL). El texto completo de los artículos publicados en los volúmenes aparecidos hasta el momento (1, 2, 3, 4, 5, y 6; años 2000-2005), pueden localizarse, en formato PostScript, en el apartado Accepted Papers.
Mathematics and Computation. Como expresa el título, una bitácora en inglés dedicada a esos temas.
LaTeX for Logicians ("A guide to resources of interest to logicians, philosophers and others using LaTeX to produce papers or presentations, teaching materials, theses or books, and in particular wanting to include logical matter such as natural deduction proofs.").
Mindswap ("The Semantic Web Research Group is a group of people working with Semantic Web technology inside the MIND LAB at University of Maryland Institute for Advanced Computer Studies").
consequently.org (Sitio personal de Greg Restall, Departamento de Filosofía, Universidad de Melbourne).
Computational Truth ("[...] Peter Gerdes's blog about philosophy and the occasional bit of mathematical logic. [...]").

Conferencias, congresos:

Progic 2005 ("Second workshop on Combining Probability and Logic: Special focus on Objective Bayesianism"; Centre for Philosophy of Natural and Social Science, London School of Economics, 6-8 julio 2005).
Library-Centric Software Design LCSD'05 (Taller de trabajo que se celebrará en el marco de la conferencia Object-Oriented Programming, Systems, Languages and Applications OOPSLA'05, San Diego, California, 16-20 de octubre 2005): "Libraries are central to all major scientific, engineering, and business areas, yet the design, implementation, and use of libraries are underdeveloped arts. This workshop is one of the first steps in the process of placing all aspects of libraries on a sound technical and scientific basis through research into fundamental issues and documentation of best practices. [...]"

A propósito de uno de los sitios referenciados (Mathematics and Computation), quiero hacer notar el sencillo sistema implementado en él para dotar a los textos de contenido y simbología matemática, haciendo para ello uso de un script de JavaScript denominado ASCIIMathML, del que hablaré más adelante.

Representación del conocimiento en la Web Semántica

2005-05-07T14:46:00.000+02:00

Dentro de la enorme bibliografía publicada sobre la Web Semántica [1] [2] [3] [4] [5], voy a recomendar en esta ocasión la lectura de dos artículos:

The Semantic Web (T. Berners-Lee, J. Hendler, O. Lassila; en Scientific American, 2001).
The Role of Frame-Based Representation on the Semantic Web (O. Lassila, D. McGuinness; 2001).

El primero es un texto de carácter introductorio y divulgativo, muy difundido y citado, perfecto para obtener una visión general sobre la cuestión, del que me gustaría destacar especialmente el apartado "Knowledge Representation" por estar muy relacionado con tema tratado en el segundo texto.

En "The Role of..." los autores proponen el esquema de representación del conocimiento (KR) basado en marcos (frame-based representation) como un paradigma para la construcción de ontologías -necesarias en su opinión para la construcción de la web semántica-, y para la conceptualización del lenguaje formal RDF [1] [2] [3] [4] [5], propuesto a tal fin como esquema básico por el WWW Consortium como expresión de la representación basada en marcos de la propia WWW.

La representación basada en marcos es un tipo de representación formal del conocimiento, derivada del esquema general de las redes semánticas (ver concretamente el apartado "4.3.2.3 Esquemas de marcos" dentro del texto enlazado). Por otra parte, las redes semánticas son un mecanismo de representación muy empleado en el ámbito de la Inteligencia Artificial (IA). En esta Introducción a la Inteligencia Artificial se ofrece, además de una perspectiva histórica general de la IA, una buena aproximación teórica a los modelos formales de representación del conocimiento y sus dominios de aplicación: ver en particular los apartados Modelos simbólicos simples de propósito general, El conocimiento del dominio y su parcelación, y Aspectos metodológicos y distribución del conocimiento. El esquema de representación del conocimiento basado en marcos fue propuesto inicialmente por el profesor del MIT Marvin Minsky -pionero de la IA, de las ciencias neuro-cognitivas, y de la lingüística computacional, entre otras disciplinas- en su ensayo A Framework for Representing Knowledge (1974).

En todo caso, y a modo ilustrativo de la dificultad que entraña la práctica de la representación del conocimiento y la recuperación de información -metadatos [1] [2] para ser exactos- en el entorno de la web semántica, nada mejor que leer al respecto el artículo de Pedro Manuel Díaz Ortuño Problemática y tendencias en la arquitectura de metadatos web (PDF; en Anales de Documentación, nº 6, 2003, págs. 35-58).

Vida Artificial: bitácora

2005-04-18T13:13:00.000+02:00

A través de los referidos (referred) de las estadísticas, he recalado en la bitácora Vida Artificial ("Inteligencia Artificial, Software Libre y algo de todo lo demás"). En ella, entre otras interesantes anotaciones y comentarios, encontramos un apartado dedicado a "colgar" traducciones al castellano de artículos publicados originalmente en Generation5 (portal dedicado a la Inteligencia Artificial y sus múltiples perspectivas), ocasión magnífica para acceder a su contenido por parte de aquellos que no dominen excesivamente (o nada) el idioma inglés, dada la buena calidad que en general suelen tener, y su orientación eminentemente práctica, aunque bien es cierto que salvo los de carácter introductorio, generalmente están pensados para ser leídos por personas con conocimientos previos sobre el tema tratado en particular. Sobre el lenguaje Prolog y el Procesamiento del Lenguaje Natural (NLP) -debilidades particulares, entre otras, de quien suscribe-, hay unos cuantos en Generation5, muy recomendables para quien desee introducirse en el conocimiento de estas cuestiones.

Glosario sobre Lógica de Primer Orden

2005-04-17T13:36:00.000+02:00

Un recurso más que recomendable, Glossary of First-Order Logic:

"This glossary is limited to basic set theory, basic recursive function theory, two branches of logic (truth-functional propositional logic and first-order predicate logic) and their metatheory."

El autor de este glosario terminológico, Peter Suber, imparte en el Departamento de Filosofía del Earlham College (EUA) el curso Logical Systems (sobre sistemas lógicos formales, lógica de primer orden estándar, y Teoría de la Computación, principalmente), desde cuya página se puede acceder, bajo el epígrafe "Hand-outs", a un buen número de textos en relación con los temas tratados en la asignatura. Los "hand outs" son materiales de trabajo (cuadernillos con textos o ejercicios), generalmente de carácter esquemático aunque no necesariamente, que se entregan a los participantes de un curso.

Al margen del mencionado curso, P. Suber desarrolla también una notable actividad en torno al Movimiento de Libre Acceso (Open Access Movement, ver su página personal, y por destacar algo al respecto, por ejemplo su bitácora monográfica sobre el particular, así como la Guide to the Open Access Movement, entre otros). También mantiene un extenso directorio de enlaces sobre Filosofía en la web: Guide to Philosophy on the Internet.

Y ya que estamos metidos en lógica y filosofía, recomendar la lectura del siguiente ensayo: Philosophical Logic and Computational Constraints (2002), de John L. Taylor, autor así mismo de una interesante bitácora, Johnny Logic. No es muy extenso y la lectura es bastante asequible, proporcionando una visión general sobre el tema enunciado en el título. A través de su bitácora he podido de paso conocer alguna otra, sobre temas relacionados con la Lógica y la Filosofía de la Lógica, como por ejemplo LogBlog, mantenida por Richard Zach (profesor de Filosofía en la Universidad de Calgary, Canadá). A su vez, la sección de enlaces (Blogroll) de esta última nos ofrece la posibilidad de conocer otras temáticamente relacionadas: That Logic Blog, Epistemic Frontiers Project, Logic and Language, etc.

Lógica estoica

2005-03-31T03:19:00.000+02:00

En la anterior anotación, citábamos el artículo Laws of Thought, publicado por Keith Devlin en su columna mensual Devlin's Angle. Bien, simplemente mencionar que en él, el autor realiza un repaso a las principales características de la lógica estoica (surgida en el seno de la escuela filosófica de los estoicos, circa 300 a.C.), que supuso el punto de arranque verdadero, junto con las aportaciones al respecto de la lógica aristotélica (a la que se debe sin embargo la sistematización de la disciplina), de los fundamentos contemporáneos de la lógica matemática en general, y proposicional en particular:

"[Los Estoicos] Realizan una ampliación de la silogística aristotélica mediante cinco formas de inferencia hipotéticas o también disyuntivas, a partir de las cuales se tiene que poder obtener cualquier conclusión válida. Mientras que la lógica aristotélica era una lógica de términos, la lógica estoica es una lógica proposicional."
[Fuente: 6.3. Estoicismo]

La lógica proposicional o lógica de enunciados, surge realmente por tanto a partir de la aportaciones de los estoicos al campo de la lógica formal (en contraposición esta última a la lógica material o teoría del conocimiento), ya que cultivan una lógica basada en proposiciones (enunciados lógicos a los que se asocian valores de verdad o falsedad) y no en conceptos (enunciados verdaderos por si mismos, por ejemplo: "Todos los hombres son mortales, Sócrates es un hombre"; necesarios para inferir, a partir de ellos, la demostración de otros: "por lo tanto, Sócrates es mortal") como en el caso de la lógica aristotélica o silogística.

Un breve repaso a las principales ramas de la lógica

Tradicionalmente se ha considerado que el origen remoto de la lógica formal es la lógica silogística o lógica clásica desarrollada por el filósofo griego Aristóteles (384-322 a.C.), si bien ya hemos dicho anteriormente que hay que considerar en el desarrollo de la lógica proposicional la decisiva aportación de los lógicos estoicos.

La lógica silogística o aristotélica, en tanto que formalización del sentido común, y en base al lenguaje natural (y por tanto no exenta de ciertas dosis de ambigüedad e imprecisión), trata de establecer la verdad o falsedad de determinado argumento filosófico.

Abandonando el campo de la formalización de los argumentos lógicos basados en el uso del lenguaje natural, la lógica simbólica o matemática arranca con las aportaciones al respecto del filósofo alemán G.W. Leibniz (1646-1717), inspiradas a su vez en el Ars Magna de Ramón Llull (1232-1316) [PDF], tratando de enfocar la lógica desde la perspectiva del álgebra, si bien no es tomada realmente en consideración hasta el siglo XIX, de la mano de George Boole (1815-1864), lógico y matemático británico, y su lógica booleana en la que otorga un tratamiento algebraico a las proposiciones de la lógica proposicional tradicional. Los trabajos de Boole en el campo de la lógica matemática permitirían a Claude Shannon [1] [2] [3] desarrollar en los años 30 del siglo XX el esquema básico de "máquina lógica" digital, inicialmente sobre la base del funcionamiento de relés que podían adoptar dos posiciones: abierto o cerrado (lógica binaria asociada al funcionamiento de un circuito eléctrico) [1] [2]. La lógica simbólica representa los conceptos mediante símbolos, siendo éstos interconectados a través de operadores.

Dentro de la lógica simbólica que se desarrolla a partir del siglo XIX hay que distinguir a su vez dos grandes ramas: la lógica proposicional por un lado, y el cálculo de predicados por otro.

La lógica proposicional [1] [2] se ocupa de establecer la verdad o falsedad de una o varias proposiciones, entendiendo por éstas sentencias correctamente formadas que pueden tomar un valor verdadero o falso, siendo conectadas las proposiciones mediante operadores.

Por su parte, el cálculo de predicados, también denominado lógica de predicados, es una extensión de la lógica proposicional que toma como base de cálculo el predicado, función que devuelve un valor verdadero o falso dependiendo de su argumento. Así por ejemplo, las bases de conocimiento de los lenguajes de programación lógica como Prolog, están construidas básicamente a base de predicados que pueden tomar en consideración uno o más argumentos, o incluso otros predicados, para inferir resultados en los procesos de interrogación. El cálculo de predicados permite por tanto la separación entre un objeto y su posible atributo, y establecer relaciones entre objetos y clases de objetos. Por otra parte, la generalización de predicados se lleva a cabo mediante el uso de variables.

Un paso adelante en el desarrollo de métodos de representación e inferencia del conocimiento basados en el uso de sistemas lógicos, particularmente en el desarrollo de sistemas expertos, sobre el uso que tradicionalmente permitían la lógica proposicional y la lógica de predicados, es la toma en consideración de factores de incertidumbre, usando a tal efecto cálculos probabilísticos tomados de la Teoría de probabilidad clásica, en una primera fase de evolución de este tipo de sistemas.

El uso de factores de incertidumbre se torna en imprescindible, en tanto que muchas situaciones dentro de los fenómenos observables en el mundo real admiten una gama de situaciones mucho más amplia que la simple y tradicional dicotomía entre verdadero y falso. A la unión entre lógica e incertidumbre, se la conoce habitualmente como lógica borrosa o fuzzy, y es el punto de partida básico y esencial para el desarrollo de sistemas y aplicaciones de Inteligencia Artificial (IA). La aplicación de factores de incertidumbre (probabilidad) en la toma de decisiones, en situaciones en las que se toma en consideración información hipotética, por parte de sistemas expertos, es por tanto la puerta de entrada básica a la IA. Es en todo caso un punto de partida muy elemental, totalmente superado hoy en día por otros enfoques a la hora de abordar la cuestión de los sistemas informáticos inteligentes.

Selección de enlaces

2005-03-30T14:19:00.000+02:00

Doy salida con esta anotación a una serie de enlaces a artículos, comentarios, sitios y eventos diversos, que por una u otra razón han merecido mi atención en las últimas semanas, sin que por supuesto estos listados sean representativos de nada en particular...

Artículos, introducciones, anotaciones de "blogs":

TouchGraph GoogleBrowser ("[...] aplicación en Java que crea un mapa relacional de una página web basada en los resultados de google [...]" vía rivadulla.info).
En Devlin's Angle, columna mensual de la Mathematical Association of America: Claude Shannon (traducción al castellano; marzo 2001); Laws of Thought (junio 1996).
Functional Programming and XML (Bijan Parsia en XML.com; también existe una versión del artículo traducida al francés). Además de los mencionados en el artículo, otro ejemplo de lenguaje basado en el paradigma de programación funcional es Curry ("A Truly Integrated Functional Logic Language"), aunque realmente se trata de un lenguaje que combina los dos paradigmas más relevantes de la programación declarativa, el ya mencionado funcional, y el de la programación lógica, dando lugar a una nueva amalgama, la programación lógico-funcional (Functional Logic Programming).
Diseño de Interfaces de Usuario Usables: Una Guía Rápida para Desarrolladores de Software Libre y de Código Abierto (texto traducido por Raúl González Duque, en Zootropo).
Koders, código fuente indexado ("Koders es [...] un motor de búsqueda de código fuente, procedente de multitud de repositorios de software públicos en Internet [...]. El código es indexado y clasificado por lenguajes de programación y licencias con las que dicho código está protegido."; en Ebarbeito).
Diseño de Arquitecturas de Información: Descripción y Clasificación (Yusef Hassan Montero, Ana Núñez Peña; en No Solo Usabilidad).
On Intelligence (reseña del libro de Jeff Hawkins, en Microsiervos).
El Modelo del Espacio Vectorial. (I): similitud entre vectores; (II): distancia entre vectores; (III): el esquema tf-idf; (IV): El Alineamiento (en Recuperación de Información en la Web).
¿Hacer cosas útiles? ("En un e-mail de mi hermano [...] leo lo siguiente: '[...] voy a empezar a meterle caña a Php y Mysql a ver si aprendo cosas útiles [...]' Dentro de esta simple frase se encuentra implícita una de las grandes polémicas de Ing. de Telecomunicaciones e Informática donde hay que dedicar varios años a estudiar matemáticas y física pura y dura. [...] Según mucha gente todo esto no sirve para nada, porque al salir al mundo laboral hay muchas cosas que importan bastante más, pero..."; en Kirai.net). En esta interesante reflexión, Héctor García aborda la presunta utilidad o inutilidad de las disciplinas académicas que se imparten en ingenierías como Telecomunicaciones e Informática, para concluir finalmente que todas ellas redundan positivamente en la formación de la persona, ya que contribuyen a modelar un tipo de pensamiento (científico) y de forma de razonar, imprescindibles para llevar a buen término y con eficacia la práctica profesional en dichos campos de las ciencias aplicadas.

Páginas y sitios web:

Interprete di un linguaggio imperativo scritto in Prolog.
PyLog - A first order logic library in Python ("PyLog is a first order logic library including a Prolog engine in Python. PyLog can also translate Prolog into Python. [...]").
Web IR & IE ("This site is a collection of online resources for research in the field of information retrieval and information extraction from the Web. [...]").
Interesting sites about Natural Language Processing / [...] about (Natural Language) Information Retrieval and Information Extraction.
DIVULGAMAT - Centro Virtual de Divulgación de las Matemáticas.

Conferencias, congresos:

MDAI (Modeling Decisions for Artificial Intelligence) 2005 (Tsukuba, Japón, 25-27 julio 2005).
LAAIC (Logical Aspects and Applications of Integrity Constraints) 2005 (in conjunction with the 16th International Conference on Database and Expert Systems Applications, DEXA 2005; Copenhagen, Dinamarca, 26 agosto 2005).
2005 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology (Compiegne University of Technology, Francia, 19-22 septiembre 2005).
TTIA'05: VI Jornadas de Transferencia Tecnológica de Inteligencia Artificial (Granada 14-16 septiembre 2005); estas jornadas se celebrarán en el marco del I Congreso Español de Informática - CEDI 2005; también en el marco de este congreso: LFSC'2005 - Simposio sobre Lógica Fuzzy y Soft Computing.
International Conference on Logic Programming (ICLP 2005) - Doctoral Consortium (Sitges, Barcelona, 2-5 octubre 2005).
XI Conferencia de la Asociación Española para la Inteligencia Artificial (CAEPIA'05; Santiago de Compostela, 23-25 noviembre 2005).
ICDM'05: The Fifth IEEE International Conference on Data Mining (Nueva Orleans, EUA, 27-30 noviembre 2005).

Dos últimos apuntes:

En fechas recientes, han cambiado de ubicación y de sistema de publicación (más flexible y potente), en Deakialli DocuMental, y por lo que se ve han aprovechado también para llevar a cabo una ligera reorientación temática, tomando especial consideración hacia los temas más directamente relacionados con la recuperación de información en sus múltiples facetas y enfoques. El cambio en todos los sentidos ha sido claramente para mejor.

En segundo lugar, y ya que más arriba nos hacemos eco de la excelente serie de artículos que sobre el modelo de espacio vectorial de recuperación de información están apareciendo en la bitácora Recuperación de Información en la Web, recomendar, a modo de introducción sobre el tema, el breve resumen que sobre el mismo apareció hace ya tiempo en el fenecido weblog rivendel.org, bajo el título Introducción a la Recuperación de Información: Recuperar información con el Modelo de Espacio Vectorial. Se puede acceder al texto en la ubicación original, o bien a través de Wayback Machine, herramienta de recuperación del proyecto Internet Archive. (Actualización 01/04/2005: Yusef Hassan también se hizo eco de esta serie de excelentes artículos en Véase Además).

Espero poder retomar en la próximas semanas un ritmo de publicación más o menos regular. Gracias a todos por mantener el interés sobre este sitio.

Sistema experto aplicado a la extracción de información

2005-01-31T11:40:00.000+01:00

Uno de los artículos incluidos en el último número de Biblos (Revista Electrónica de Ciencias de la Información; nº 20, octubre - diciembre 2004), lleva por título "Ensayo de un sistema de extracción de información (técnica de inteligencia artificial) en un centro de información especializado en sanidad vegetal." (el artículo en sí está en formato PDF). Escrito por Ingrid Paz García (Cuba), en él se detalla un sistema experto aplicado a la extracción de información de artículos de carácter científico, cuya temática versa en este caso sobre la sanidad vegetal. La extracción de información -una de las tareas más relevantes dentro de lo que se ha dado en conocer como minería de datos [1 -PDF-] [2] [3] [4] [5] o data mining-, añade complementariamente, a las técnicas clásicas de la recuperación de información, otras propias del ámbito de la inteligencia artificial, que permiten obtener hechos (datos relevantes) a partir de los documentos recuperados.

Por cierto, y en relación con el data mining, hay muchos expertos en la materia a los que no les gusta la traducción literal "minería de datos"; prefieren expresiones más ajustadas al sentido y uso original del término anglosajón tales como "explotación de datos" o "descubrimiento de datos", por ejemplo.

El sistema experto descrito en el artículo, utilizado para la extracción de información relevante de artículos de contenido científico-técnico, recibe la denominación SEISAV (Sistema de Extracción de Información en Sanidad Vegetal), y está basado en el sistema CRYSTAL (Universidad de Massachussets), orientado al tratamiento de textos exclusivamente en inglés, por lo que ha sido convenientemente adaptado para trabajar con las particularidades lingüísticas del idioma castellano, y dotado de mayores posibilidades de uso. Induce (construye) automáticamente reglas de análisis de los textos a partir de un entrenamiento previo (método de "Entrenamiento automático"), si bien estas reglas pueden ser construidas manualmente por un experto familiarizado en este tipo de sistemas, y en el dominio específico de aplicación (método de "Ingeniería por Conocimiento").

El sistema CRYSTAL es un shell (entorno de desarrollo) diseñado originalmente para trabajar bajo MS-DOS, comercializado en Europa por Intelligent Environments. Sin embargo, nuevos entornos (AM para Windows) relegaron el desarrollo de CRYSTAL como producto comercial en los años 90 del siglo pasado.

El funcionamiento del sistema, y varios ejemplos de uso, están perfectamente explicados en el artículo, de forma bastante amena, con un nivel de complejidad muy asequible incluso para las personas sin conocimientos previos en relación con los sistemas expertos [1] [2] [3] [4] [5] [6] [7], que hace que sea una lectura más que recomendable para toda persona interesada en la puesta en marcha de estos sistemas aplicados al tratamiento documental y la gestión de la información de carácter significativo (en contraposición a la recuperación y tratamiento de información en "bruto").

Reseñas de libros sobre lógica y demostración en MAA Online

2005-01-03T14:14:00.000+01:00

En Proofs and Logic Solving Book Reviews, se listan todas las reseñas publicadas en la web de la Mathematical Association of America (MAA Online), dentro de la sección Read This! - The MAA Online book review column, sobre monografías cuya temática principal gira en torno a la lógica y la demostración, así como disciplinas conexas de la matemática, como por ejemplo la teoría de conjuntos. Para localizar reseñas sobre otras temáticas del ámbito de estudio de las matemáticas, acudir al índice por temas.

También son destacables en la web de MAA Online, las breves columnas mensuales (en el menú desplegable de la izquierda del portal de entrada, están recogidas bajo el epígrafe "Publications, Columns"), escritas por diversos autores sobre toda clase de temas relacionados con el amplio universo de las matemáticas, como por ejemplo la de Keith Devlin, la más veterana de todas, publicada bajo el epígrafe Devlin's Angle; este autor, y sobre el tema de la lógica y la deducción, tiene alguna cosa interesante, como son los breves comentarios The mathematics of human thought, Laws of Thought y Are Mathematicians Turning Soft?, entre otros.

Actualización (07/01/2005): en el artículo de este mes (enero 2005), Last doubts removed about the proof of the Four Color Theorem, K. Devlin da cuenta de nuevas aportaciones en la demostración, mediante medios informáticos, del Problema de los Cuatro Colores [1] [2] [3], un clásico en el campo de la lógica deductiva, la demostración matemática, la topología, y la combinatoria, y hace un repaso a las diversas conjeturas que este problema a suscitado a lo largo del tiempo. Este problema se puede definir, brevemente, mediante el siguiente enunciado:

"En un plano o en una esfera no se necesitan más de cuatro colores para colorear un mapa de manera que dos regiones vecinas, es decir, que compartan una frontera y no únicamente un punto, no queden coloreadas del mismo color"
[Fuente]

John McCarthy, uno de los pioneros de la Inteligencia Artificial, analizó, en el artículo Coloring Maps and the Kowalski Doctrine (1982), un programa escrito en Prolog, y sus algoritmos subyacentes, que resolvía este problema aplicando la metodología de la programación lógica a demostraciones matemáticas anteriores, alcanzadas tras el enunciado del problema en la segunda mitad del siglo XIX.

Artículos, comentarios, y otros enlaces diversos

2004-12-21T02:14:00.000+01:00

En estos últimos meses de ausencia de producción escrita por estos lares, he ido tomando nota de una serie de artículos, comentarios en bitácoras, y otros enlaces de diversa naturaleza, que han merecido mi interés por una u otra razón, siempre en función de la temática sobre la que versa o pretende versar este sitio. No se trata de una lista exhaustiva (de todo lo que he leído y me ha interesado), ni ordenada con excesivo criterio o rigor...

Artículos, introducciones, anotaciones de "blogs":

A taste of Poplog (1) y (2) (sobre el entorno de desarrollo Poplog; en Efectos Especiales).
Pythologic - Prolog syntax in Python (en Lambda the Ultimate).
Description Logics in Literate Haskell / SAT 3 Proof with E Prover via OWL (en Lambda the Ultimate).
NewLisp: A better Lisp/Scheme Fusion ("newLISP is a general purpose scripting language for developing Web applications and programs in general and in the domain of Artificial Intelligence (AI) and statistics."; en Lambda the Ultimate).
The Science of Word Recognition (Kevin Larson - Advanced Reading Technology, Microsoft Corporation).
Intelligent library systems: artificial intelligence technology and library automation systems (Bailey, Jr., Charles W., 1991).
What is Artificial Intelligence? (por Jack Copeland en Catalogue of Reference Articles - AlanTuring.net).
The Calculus of Logic (Por George Boole, 1815-1864, lógico y matemático británico, creador del primer sistema formal de lógica matemática o simbólica, denominado álgebra de Boole o álgebra lógica, cuyo ámbito es el estudio de las funciones lógicas).
Does Fit fit your testing needs? ("I needed to perform some acceptance testing on a Prolog parser, and found some sample Prolog text from the BinProlog engine that I could use for the task at hand. To automate the process, I decided to use Fit because [...]"; en Through the blogging-glass).
Natural Language Processing Using Linux ("This article will discuss how to perform simple textual analysis such as word counts, bigrams and trigrams, using standard Linux tools. [...]"; en Generation5).
Self-Organizing Nets ("After a detailed look at supervised networks [...] we should look at a good example of unsupervised networks. The Kohonen network is probably the best example, because it is quite simple yet introduces the concepts of self-organization and unsupervised training easily. [...]"; en Generation5).
Cómo NO realizar una práctica de programación (vía Ceklog).
Functional Programming in the Real World ("[...] a list of functional programs applied to real-world tasks.").
Metadata? Thesauri? Taxonomies? Topic Maps! (conocido a través del "blog" K-Utopía).
A CLP + CHR bibliography ("For future reference, here is a list of CLP and CHR related works I?ve been reading in the last weeks. In memoriam of a project I?m not going to pursue anymore."; en Through the blogging-glass). Sobre Programación Lógica con Restricciones (CLP), ver por ejemplo la introducción Constraint Logic Programming (BYTE magazine, febrero 1995), o bien esta otra, en la que primero se hace un repaso general a la programación con restricciones. La última versión en desarrollo de SWI-Prolog, soporta clp(R): "Beta version of Constraint Logic Programming over Reals library". Por su parte, CHR son las siglas de Constraint Handling Rules: "CHR was designed as a language for defining constraint solvers, but at the same time it is one of the most powerful multiset rewriting languages. [...] CHR are a high-level language for concurrent logical systems. CHR make it easy to define constraint reasoning: simplification and propagation as well as incremental solving of constraints. [...]" [fuente].
RDF and Databases (en Lambda the Ultimate).
Orientación a objetos en Prolog (formato PDF; "La posibilidad de incorporar elementos del paradigma de orientación a objetos en la programación lógica parece, a priori, interesante, dado que permitiría sumar lo mejor de ambos mundos. Los lenguajes de programación lógica han tenido siempre como ventaja el permitir enfocar la atención del programador en el problema a resolver y en el diseño de la solución, más que en la mecánica de la misma. La incorporación de orientación a objetos ayudaría en la reutilización del código, ocultamiento de información y además permitiría realizar un diseño más claro de las soluciones. En este trabajo se estudia una aproximación al tema de la orientación a objetos en Prolog, la realizada por el módulo Prolog Objects de SICStus Prolog. Se muestran las ideas principales del módulo, su sintaxis y funcionamiento, para presentar finalmente algunos ejemplos de diseño utilizando el paradigma."; D. Perovich y G. Moncecchi, 2002).
Otro ejemplo de implementación de Prolog que soporta programación orientada a objetos es Ciao Prolog: "O'Ciao is a set of libraries which allows object-oriented programming in Ciao Prolog. [...]" (fuente: Reference Manual - Object oriented programming).
Introducción a la deducción natural (D. Clemente Laboreo; la deducción natural consiste en un conjunto de procedimientos formales -lenguaje de la lógica formal- cuyo fin es la demostración de la corrección de determinado razonamiento, es decir, la validad de dicho razonamiento -no su invalidez, sin embargo-; este documento también está disponible en formato PDF).

Páginas y sitios web:

TechBooksForFree.com (Free Programming and Computer Science Books; vía Ceklog).
Web Semántica Hoy.
Premise.org (selección de enlaces sobre el campo de la Inteligencia Artificial).
Aprende Lógica (esta página mereció uno de los segundos premios en el concurso de la edición 2003 convocado por el Ministerio de Educación y Ciencia a través del Centro Nacional de Investigación y Comunicación Educativa -CNICE-).
Recuperación de Información en la Web ("Bitácora dedicada a la recuperación de la información en la Web, centrada no únicamente en los aspectos tecnológicos de la misma, sino también en noticias de marcada incidencia social."). Artículos y comentarios muy buenos, escritos por F. J. Martínez Méndez -profesor de la Facultad de Comunicación y Documentación de la Universidad de Murcia- con mucho rigor y al tiempo amenidad sobre toda clase de temas relacionados con las técnicas de recuperación de información, con una particular atención en la incidencia de las mismas en los entornos web. Ver a modo de ejemplo uno de los últimos comentarios: ¿Es la "realimentación por relevancia" una técnica de recuperación de información?.
Glosario de Recuperación de Información Web (por Adriana Colino Tomé).
Prolog interpreter in Javascript.
Laboratorio Digital del Máster Online en Documentación Digital (Universitat Pompeu Fabra; Incluye, además de varias utilidades desarrolladas con las API de Google, las herramientas: DigiDocMap -editor de mapas conceptuales-, DigiDocMenu -editor de menús desplegables-, y DigiDocIndex -indexador y generador de buscadores locales-).
X-Prolog: a type-based system for XML processing in Prolog (J. Coelho, M. Florido. También de estos dos autores, la ponencia Type-based XML Processing in Logic Programming -en PDF- ofrece una exposición del funcionamiento y aplicación de X-Prolog en el procesamiento de código XML. Para su funcionamiento necesita tener instalado SWI-Prolog y cargada la librería o módulo SGML. Con propósito general, comentar que en el capítulo 5 -Using Modules- del manual de referencia de SWI-Prolog, se explica cómo usar módulos externos. En el caso de la librería SGML, los predicados necesarios para procesar XML se compilan al cargar el archivo "sgml.pl", localizado en la carpeta "library" del directorio de instalación de SWI-Prolog -generalmente y por defecto "Archivos de programa\pl\"-).
Diseñorama ("[...] es un sitio de tutoriales, artículos y recursos para diseñadores web sobre estándares, accesibilidad, usabilidad y programación.").

Conferencias, congresos:

AIED 2005 - The 12th International Conference on Artificial Intelligence in Education (18-22 de julio 2005, Amsterdam).
ECIR'05 - 27th European Conference on Information Retrieval (21-23 de marzo 2005, Santiago de Compostela).
7º Congreso ISKO-España (6-8 de julio 2005, Barcelona).
PADL 05 - Seventh International Symposium on Practical Aspects of Declarative Languages (10-11 de enero 2005, Long Beach, California).

Comentar por último que mi intención es ir publicando de aquí en adelante, y con una periodicidad más o menos mensual, sucesivas listas de los artículos, reseñas y otros textos y enlaces, que me parezcan más relevantes, relacionados directa o indirectamente con los asuntos tratados por lo general en este blog.

Una introducción general al lenguaje Prolog

2004-12-17T03:30:00.000+01:00

A quienes busquen una introducción básica (muy básica eso sí) al lenguaje Prolog, les recomiendo la lectura del artículo o "white paper" de Gerardo Rossel "Programación lógica":

"Un recorrido por la programación lógica y uno de sus lenguajes más representativos: Prolog, clásico de la inteligencia artificial, que se aplica de múltiples formas en el desarrollo de software comercial"
[Fuente: entradilla del artículo]

En la introducción del artículo se define de forma muy clara y concisa la famosa "ecuación" de Kowalski (a la que quizás recordarán dediqué un comentario bastante extenso -no tan claro y conciso-, hace ya tiempo, en la anotación "A propósito de la fórmula de Kowalski"). Leemos lo siguiente en dicha introducción:

"[...] La ecuación de Robert Kowalski [...] establece la idea esencial de la programación lógica: algoritmos = lógica + control. Es decir, un algoritmo se construye especificando conocimiento en un lenguaje formal (lógica de primer orden), y el problema se resuelve mediante un mecanismo de inferencia (control) que actúa sobre aquél."

Publicado en el número 7 de la revista .code, el texto completo del artículo se puede localizar, en formato PDF, a través de la página de Amzi!, empresa dedicada al desarrollo de aplicaciones y sistemas expertos sobre la base de los fundamentos de la programación lógica en sinergia o conjunción con otras tecnologías y lenguajes:

"Amzi! specializes in products and services for developing and deploying integrated application components that apply logical knowledge, such as pricing rules, configuration logic, insurance regulations, diagnostic and advisory knowledge, grammar rules, message translation rules, and semantic relationships. [...]"
[Fuente: Amzi! Technology, Products and Services Overview]

Especialmente reputado es su entorno de desarrollo Amzi! Prolog + Logic Server ("Embeddable, extendable Prolog for programmers to build high-performance rule-based systems."). Por otra parte, en el apartado "Articles & Links" encontramos, en inglés, un buen número de introducciones, tutoriales, artículos, y otras referencias, sobre el lenguaje Prolog y sus múltiples aspectos prácticos, con una especial atención a su aplicación en el desarrollo de sistemas expertos.

Para finalizar, comentar que, increíble e inmerecidamente (y no es falsa modestia), se referencia a este espacio de publicación con formato de bitácora desde el que escribo estas líneas, en el apartado "Enlaces relacionados", que se puede encontrar al final del artículo de Gerardo Rossel. La publicación de esta breve reseña no tiene nada que ver con dicha circunstancia, de hecho reparé en ella una vez que me puse a escribir y releí con mayor atención el texto del artículo...

Inicios de la programación informática: ASCII y Cobol

2004-06-28T14:27:00.000+02:00

El pasado martes 22/06/2004, falleció en EE.UU. Robert W. Bemer, pionero de la programación de ordenadores. Entre sus méritos profesionales se cuenta el haber contribuído decisivamente al establecimiento del estándar ASCII [1] [2] de representación e intercambio de información, y al desarrollo del lenguaje de programación COBOL. Con motivo de su fallecimiento, el diario El País publicó en la edición de ayer 27/06/2004 una breve nota biográfica, traducción del texto original editado en The New York Times, de la que extractamos los párrafos que hacen referencia al trabajo de Bemer en el campo de la programación informática:

Robert W. Bemer, pionero de la programación de ordenadores

Robert W. Bemer, uno de los primeros programadores de ordenadores, que contribuyó a idear ASCII, un sistema que sigue estando en uso para representar letras y números en código [...] empezó a trabajar con ordenadores cuando hacía trabajos de ingeniería en aviones militares para la Rand Corporation de California, en 1949. "Allí conocí los primeros ordenadores IBM y me enamoré de su técnica. Supe que estaba hecho para el mundo de los ordenadores. Este negocio estaba en su primera infancia, y programar era un trabajo que se hacía a la medida; normalmente implicaba preparar máquinas para que hicieran cálculos de uno en uno. Hasta 1958 no se publicó la primera mención al término software como término informático. El software no era una actividad independiente, sino simplemente algo por lo que había que pagar para conseguir que los ordenadores, que tenían entonces el tamaño de una habitación, pudieran hacer su trabajo", escribió en una serie de recuerdos en su página web.

Brillante, locuaz e irreverente, Bemer pareció encajar exactamente en el papel durante los primeros años alocados de la programación. Trabajó para fabricantes de aviones en California, hasta 1955, que se incorporó al departamento de investigación de programación de IBM en Nueva York. No había preparación oficial para programadores, y durante un tiempo Bemer estuvo encargado de reclutarlos.

Bemer desempeñó un importante papel contribuyendo a desarrollar un sistema estándar para traducir letras y números a un código digital que podía ser procesado por un ordenador, conocido como Código Estándar Americano para Intercambio de Información, o ASCII (siglas en inglés). Antes de ASCII, los fabricantes de ordenadores tenían sus propios sistemas para codificar letras y números, lo que hacía difícil o imposible el intercambio de datos entre máquinas de distintos fabricantes de ordenadores. A finales de los años cincuenta y principios de los sesenta, Bemer fue uno de los principales defensores e impulsores del estándar, bajo la orientación del Instituto Americano de Estándares Nacionales (después fue adoptado por la Organización Internacional de Estándares). ASCII se puso en práctica en 1963, se fue expandiendo y modificando a lo largo de los años [...]. Bemer apoyó decididamente el ASCII, a pesar de que la dirección de IBM defendía su propio estándar de codificación. En 1962, Bemer dejó IBM para incorporarse a la división Sperry Sand's Univac. A su manera, el estándar ASCII fue un precursor de los estándares para intercambio y lectura de datos que permiten la comunicación a través de Internet y la web mundial.

A finales de los años cincuenta, Bemer desempeñó un papel en otro estándar informático importante, el lenguaje de programación Cobol. El Departamento de Defensa quería un lenguaje común para datos de contabilidad y administración, y el resultado, a finales de 1959, fue Cobol, siglas inglesas de Lenguaje Común Orientado a la Administración. [...]

Como su propio nombre indica, COBOL (COmmon Business Oriented Language) fue un lenguaje de programación creado en 1959-1960, en el seno del comité CODASYL (Conference on Data Systems Languages) -auspiciado a partir de 1957 por el Departamento de Defensa de los EE.UU- para ser aplicado en tareas de gestión administrativa y contable.

De gran facilidad de lectura, merced a una sintaxis muy cercana a la expresión del lenguaje natural en idioma inglés, se le achaca sin embargo a COBOL ser un lenguaje excesivamente rígido en su formato de escritura, de sentencias muy largas, y no adecuado para las técnicas de programación estructurada (Pascal y C, por citar algunos, son ejemplos de lenguajes orientados a la programación estructurada).

Por otra parte, la alta estandarización adoptada desde el inicio de su desarrollo, y la especial atención de este lenguaje a la correcta expresión de las estructuras de datos [1] [2], entre otras características, ha permitido que todavía hoy en día sigan operando, en el mundo bancario, empresarial y comercial, aplicaciones con 40 años a sus espaldas, demostrando una solidez y estabilidad muy notables, una vez superados los problemas que el denominado "efecto del año 2000" (consistente en los problemas derivados del uso de dos dígitos para almacenar fechas en los sistemas antiguos) supuso, en algunos casos, para su operatividad y correcto funcionamiento.

Más información sobre el lenguaje COBOL: [1] [2] [3] [4] [5] [6] [7]

Conciencia humana e inteligencia artificial

2004-06-03T02:17:00.000+02:00

Para romper el largo periodo de tiempo transcurrido sin dejar nada escrito por estos lares, y en espera, entre otras cosas, de mayores cotas de inspiración, indico a continuación algunos artículos y anotaciones que me han llamado agradablemente la atención en las últimas semanas:

Self Organizing Maps (por T. Germano; descripción de la aplicación de las redes neuronales artificiales a la clasificación y visualización de información).
Lógica Difusa - Fuzzy Logic (por Héctor García en Kirai.Net).
A Prolog introduction for hackers (comentario en Through the blogging-glass al tutorial sobre Prolog publicado en kuro5hin.org).
¿Cómo funciona un buscador? [1], [2], [3] y [4] (por Héctor García en Kirai.Net).
Problema de Asignación de Horarios (aplicación práctica de ciertos aspectos de la teoría de grafos; A. Arranz Ordóñez y E. Cuesta Guzmán, en Programación en Castellano).
Multi-Backpropagation Network: Concept and Modeling ("Backpropagation network is one of the well known NN model. However, large network is too complex and takes a long time to train..."; en Generation5).
George Boole (sobre la lógica booleana, digital o binaria; por Héctor García en Kirai.Net).

Como puede verse, un lugar preferente de mención en esta pequeña lista, se lo lleva sin duda Héctor García, y en este punto me parece pertinente comentar que es muy encomiable la forma que tiene de abordar los temas de los que trata por lo común en su bitácora (Kirai.Net), al margen de aquellos de carácter e interés más o menos estrictamente personal y particular, a saber: fundamentos de computación, Inteligencia Artificial y sus aplicaciones, programación en general... Se nota de verás su notable esfuerzo por hacer asequibles y comprensibles, para "el común de los mortales", dichos asuntos.

En otra de sus anotaciones, "El test de Turing y los ordenadores Inteligentes", aborda un tema que tradicionalmente ha levantado, y sin duda seguirá levantando, gran polémica y diversidad de opiniones: básicamente, aquella que se refiere a cómo definir lo que podríamos denominar como verdadera inteligencia artificial, cuales son las características diferenciadoras y definitorias de un sistema autónomo, para considerar que está dotado de las propiedades y funciones inherentes a la inteligencia humana (si es que algún día se alcanza a conocer y comprender la totalidad de esas propiedades y funciones, desde una perspectiva unitaria), es decir aquellas que son expresión de la naturaleza y funcionamiento de los procesos cognitivos, de razonamiento y aprendizaje, que se dan en la mente de los seres humanos.

En los comentarios a dicha anotación, podemos leer interesantes opiniones al respecto, y en este punto me gustaría aportar una reflexión hecha por el escritor y crítico inglés David Lodge [1] [2], en el contexto de una entrevista publicada en la edición del suplemento Babelia del diario El País del pasado 1 de mayo ("En defensa de la ficción", básicamente versa sobre la importancia del género de la novela, de la ficción, en tanto que instrumento de representación de la conciencia humana, variable en función de distintos periodos a lo largo del tiempo). Pregunta la entrevistadora (Lourdes Gómez): "¿Cree que la conciencia es el software de la mente humana?", y Lodge contesta:

«En el sentido literario es una buena metáfora para describir la conciencia. Otra cuestión es si la mente humana funciona como un ordenador. Yo creo que el ordenador es un tipo de cerebro bastante limitado. Se dan analogías en su funcionamiento, pero también importantes diferencias. Principalmente en la conectividad de la mente humana y la ejecución de funciones simultáneas. Un ordenador nunca podrá replicar estas características pese a lo que nos aseguren los expertos en inteligencia artificial. Los ordenadores son mucho más rápidos que el cerebro humano, pero no creo que sean capaces de eliminar intuitivamente los elementos irrelevantes de una función. Nos ganarán en el ajedrez, pero nunca en la toma de decisiones que requiere una habilidad intuitiva.»

Apartándome un tanto de la reflexión de Lodge -que en todo caso no deja de ser una opinión, avalada eso si por el conocimiento atesorado en dos años de estudio dedicados a las ciencias cognoscitivas, la inteligencia artificial y el fenómeno de la conciencia, con la vista puesta en la preparación de su novela Pensamientos secretos (Anagrama, 2002; ISBN: 84-339-69893-8), como explica el propio autor en la entrevista-, y sin pretender entrar en grandes profundidades en lo que se refiere a este tema, es evidente que difícilmente se podrán trasladar las características de la inteligencia humana y sus procesos cognitivos a un sistema autónomo artificial, creando por tanto "inteligencia artificial", si no se alcanza a entender en su totalidad el funcionamiento de dichos procesos, y parece ser que las disciplinas científicas que se ocupan de estos menesteres (tanto en lo que se refiere a los procesos físico-químicos, como los referidos a los de transferencia y procesamiento de información), están bastante lejos de alcanzar un estado de conocimiento óptimo y "global" acerca de las evidentes complejidades, mayores de las que en un principio se pensó al abordar su estudio, de la mente humana.

Seminarios sobre Programación Lógica y Declarativa

2004-04-14T10:30:00.000+02:00

Nos hacemos eco en esta ocasión de tres citas que, en el ámbito de las conferencias y los encuentros referidos a la programación declarativa/funcional (en PDF) y lógica, están por celebrarse en los próximos meses:

1st European Lisp and Scheme Workshop (Oslo, 13 de junio 2004)

"Lisp has a tradition of providing a fruitful basis for language design experiments for many decades. The structure of Lisp, including Common Lisp and Scheme as its major dialects of today, makes it easy to extend the language or even to implement entirely new dialects without starting from scratch. Common Lisp, with the Common Lisp Object System (CLOS), was the first object-oriented programming language to receive an ANSI standard at the beginning of the 1990's. It is, arguably, the most complete and advanced object system of any programming language, and has influenced many other object-oriented programming languages that were to follow."
[continúa]

Colloquium on Implementation of Constraint and LOgic Programming Systems (CICLOPS 2004)

"This workshop aims at discussing and exchanging experience on the design, implementation, and optimization of logic, constraint (logic) programming systems, and systems intimately related to logic as a means to express computations. Experience backed up by real implementations and their evaluation will be given preference, as well as descriptions of work in progress in that direction."
[continúa]

The 14th workshop on logic programming environments (WLPE' 04)

"The aim of the workshop is to provide an informal meeting for the researchers working on tools for the development and analysis of logic programs. This year we want to emphasize two aspects: on one hand we want to discuss the presentation, pragmatics and experiences of such tools; on the other one, we want to extend the concept of "logic programming" environments to tools developed for any language based on computational logic (constraints, integration of paradigms, specification languages, ...)."
[continúa]

De la primera cita (de cuya celebración nos hemos enterado vía Bill Clementson's Blog, "Bits and pieces (mostly Lisp-related) that I collect from the ether") están disponibles, en formato PDF, los papers (comunicaciones, ponencias) recibidos hasta el momento. En cuanto a los workshops (talleres de trabajo, seminarios) CICLOPS 2004 y WLPE' 04, decir que se celebrarán en el marco la 20th International Conference on Logic Programming (ICLP'04, 6-10 de septiembre 2004, Saint-Malo, Francia), organizada por la Association for Logic Programming (ALP).

Manuel Carro y José Manuel Gómez-Perez, dos de los organizadores y coordinadores de los seminarios encuadrados en la ICLP'04 a los que acabamos de hacer referencia, son miembros del CLIP Lab (The Computational logic, Languages, Implementation, and Parallelism Lab) de la Facultad de Informática, Universidad Politécnica de Madrid, cuya área de actividad se centra en la Programación Lógica en general y la Programación Lógica con Restricciones (Constraint Logic Programming, CLP) en particular. En este contexto de actividad, los miembros del CLIP Lab han desarrollado el sistema Ciao Prolog:

"[...] entorno de programación lógica y de restricciones [...] es uno de los sistemas desarrollados por el grupo CLIP. [...] es software libre [...] y se está utilizando actualmente tanto en aplicaciones empresariales como en el entorno académico [...]. Entre las ventajas ofrecidas por Ciao Prolog resalta su extensibilidad, que ha permitido desarrollar muchas librerías que añaden funcionalidades significativas al sistema, tales como resolutores de restricciones, concurrencia, primitivas para la programación distribuida y de agentes inteligentes, persistencia, orden superior, objetos, interfaces a otros lenguajes de programación, etc. Como ejemplos podemos destacar la librería PiLLoW, posiblemente el componente más utilizado para la interconexión entre sistemas de programación lógica (y de restricciones) y la WWW, y LPdoc, un generador automático de documentación para sistemas de programación lógica y de restricciones, ambos distribuidos como software libre."
[fuente]

La mayor parte de los informes técnicos (Technical Reports) producidos por los miembros del CLIP Lab, están disponibles para su consulta, ordenados por área de interés y por año de producción (los formatos de los documentos son PDF y PS). Salvo que se busque un texto en concreto, del que se tenga noticia previamente, en cuyo caso es más directo y rápido realizar la búsqueda por año, lo más práctico y productivo es efectuarla a través de la ordenación por tema de investigación. Más información sobre las conferencias y seminarios coorganizados por este laboratorio en la página correspondiente.

Prolog + Scheme = Schelog

2004-04-07T18:43:00.000+02:00

Schelog es una implementación desarrollada por D. Sitaram que permite combinar fragmentos de código escritos en un estilo de programación similar a Prolog (incluyendo las principales características de este lenguaje tales como el backtracking o retroceso, la unificación, el corte, la negación, predicados meta-lógicos, etc.) con expresiones en Scheme puro o convencional (Scheme es un lenguaje derivado de Lisp - ver la anterior anotación en la que hacíamos referencia a este último), dentro de una misma aplicación:

Schelog is an embedding of Prolog-style logic programming in Scheme. "Embedding'' means you don't lose Scheme: You can use Prolog-style and conventional Scheme code fragments alongside each other. Schelog contains the full repertoire of Prolog features, including meta-logical and second-order ("set'') predicates, leaving out only those features that could more easily and more efficiently be done with Scheme subexpressions.
En Programming in Schelog

La sintaxis de Schelog es la propia del lenguaje Lisp/Scheme (básicamente, consiste en listas anidadas e indentadas, sin comas, indicadas mediante paréntesis, anteposición de los signos de operación a los argumentos, cadenas de caracteres entre comillas, etc.). A modo de ejemplo, se indica a continuación la porción de código necesaria para calcular, recursivamente, el factorial de un número, en Prolog en primer lugar, y en Schelog en segundo (recordemos que el factorial de un número natural n, es el producto de todos los números naturales desde 1 hasta n):

factorial(0,1):- !.
factorial(X,Y):- X1 is X-1,
                 factorial(X1,Y1),
                 Y is X*Y1.

(define %factorial
  (%rel (x y x1 y1)
    [(0 1) !]
    [(x y) (< x 0) ! %fail]
    [(x y) (%is x1 (- x 1))
           (%factorial x1 y1)
           (%is y (* y1 x))]))

Schelog puede ser considerado como una combinación entre los estilos de programación o paradigmas representados por el lenguaje Prolog por un lado (programación lógica), y el dialecto de Lisp Scheme por otro (programación declarativa y funcional). "Programming in Schelog" es una introducción en la que el mencionado D. Sitaram aborda la sintaxis y la programación mediante la implementación que venimos comentando. Por otra parte, y de este mismo autor, "Teach Yourself Scheme in Fixnum Days" es una guía rápida e introducción al lenguaje Scheme.

Finalmente, recomendar la lectura de una introducción de carácter general, referida a los orígenes del lenguaje Scheme: "Scheme: lo pequeño es bello - Un lenguaje de programación ideal para la enseñanza" (Carlos Coello). Este artículo fue publicado posteriormente (formato PS comprimido en un .zip) por el autor, con idéntico título y más extensión y profundidad, en la revista Soluciones Avanzadas (números 39 y 43; actualmente esta publicación parece no estar disponible en línea, si bien en Internet Archive es posible localizar varias copias). Esta nueva versión ampliada de "Scheme: lo pequeño es bello..." añade, a la explicación de la parte histórica y de desarrollo del lenguaje Scheme, una introducción, con ejemplos, a sus características esenciales y sintaxis de uso, principales versiones y extensiones, así como una consideración final en torno a su utilidad en la investigación y enseñanza en el campo de los lenguajes de programación ("Scheme como un instrumento para la enseñanza").

Lisp y Java -artículo-

2004-04-02T01:39:00.000+02:00

No todo va a ser Prolog en el ámbito de la programación declarativa... A través de Lemonodor, weblog dedicado al lenguaje Lisp (LISt Processing) y sus tecnologías asociadas (aunque también tratan bastantes temas relacionados con la robótica), llegamos al artículo Lisp and Java (D. Milstein):

"First-class functions are a powerful feature of the Lisp programming language. This article describes some ways they can be used, and explores how to approximate them in Java."

El lenguaje Lisp [1] [2] [3] [4] [5], desarrollado inicialmente a finales de los años 50 del siglo pasado por John McCarthy (ver al respecto su ensayo History of Lisp), es sin duda uno más conocidos y utilizados dentro del paradigma de programación declarativo/funcional, y base para el desarrollo de otros lenguajes y dialectos similares, de características más avanzadas y modernas, o simplemente orientados hacia otros ámbitos de aplicación (es el caso, por ejemplo, del lenguaje Logo). Lisp es un lenguaje muy utilizado y extendido en el mundo anglosajón, específicamente en Estados Unidos, sobre todo mediante la implementación Commom Lisp, y tradicionalmente se ha utilizado, tanto en el ámbito académico como en el empresarial, para programar aplicaciones orientadas a procesos de Inteligencia Artificial (AI) -de hecho puede decirse que fue creado y desarrollado con esta finalidad, y es considerado por tanto "el primer lenguaje de IA"-, y procesamiento del lenguaje natural (NLP), si bien hoy en día es posible incluso encontrar, por poner un ejemplo de sus múltiples aplicaciones, servidores web desarrollados mediante este lenguaje de programación.

Más información sobre el lenguaje Lisp:

Practical Common Lisp (Peter Seibel).
On Lisp (P. Graham).
LISP Primer (C. Allen, M. Dhagat; otra ubicación).
CLiki, the common lisp wiki.
A Concise Introduction to LISP (David L. Matuszek).
Common Lisp: A Gentle Introduction to Symbolic Computation (David S. Touretzky).
Common Lisp the Language, 2nd Edition (otra ubicación).
Lisp FAQ.
Early LISP History (1956-1959) / The Influence of the Designer on the Design - J. McCarthy and LISP (H. Stoyan).
Lisp Lectures (N. Levine).
LISP Tutorial (M. Schwarz).
Successful Lisp: How to Understand and Use Common Lisp (David B. Lamkins).
The Common Lisp Cookbook.
How to Use Scheme. Writing Scripts and Programs with PLT Scheme (M. Felleisen et al.).
Teach Yourself Scheme in Fixnum Days (D. Sitaram).

Para ilustrar los ejemplos, el autor de Lisp and Java ha utilizado un dialecto de Lisp, denominado Scheme [1] [2].

El artículo está publicado en ONJava.com (de cuya portada principal hemos tomado la breve sinopsis en inglés), estupenda fuente de referencia en la que encontrar buenos artículos y otras referencias relativas al lenguaje Java y sus múltiples aplicaciones. Por otra parte, ONJava.com es una publicación electrónica englobada bajo el proyecto corporativo O'Reilly.com de Tim O'Reilly, dedicado a la publicación de libros, impartición de conferencias y cursos, y creación de sitios web (Resource Centers) y publicaciones on-line (Online Publications: XML.com, Perl.com, etc.) sobre tecnologías informáticas y lenguajes de programación (Perl, Python, C/C++, XML, .NET, etc.), con una clara orientación hacia aquellas tecnologías relativas al desarrollo de aplicaciones bajo entornos web.

A propósito de la fórmula de Kowalski

2004-03-30T13:42:00.000+02:00

Siguiendo el estilo del que hasta hace poco tiempo era el diseño de mi bitácora hermana, hace poco más de un mes se cambió el aspecto de ProLog IR, si bien, por diversas circunstancias -las mismas que durante este tiempo han mantenido en "silencio" este espacio de publicación- hasta este momento no se ha hecho una referencia explícita a esta circunstancia. Básicamente el trabajo de rediseño ha consistido en eliminar las tablas como sistema de maquetación, y realizar ésta última enteramente con CSS. La ventaja de tener la página estructurada de esta forma, al margen de cumplir más o menos con los estándares existentes al efecto, es que se pueden separar completamente los bloques de contenido de la presentación en sí, y de esta manera introducir más fácilmente futuros cambios de estilo y aspecto. De hecho el estilo que se puede ver en estos momentos pretendo que sea provisional, ya que entre otras cuestiones, y en su actual configuración, puede presentar algunos problemas de visualización en Internet Explorer (¡como no!), según sea la resolución de pantalla utilizada.

También tengo en mente un futuro cambio de hospedaje y de sistema de publicación (¿WordPress?) a corto plazo, si el tiempo y las ganas lo permiten... En cualquier caso, lo importante, y de lo que se trata, cuestiones de estilo al margen, es ofrecer contenidos interesantes, y en este sentido espero "ponerme las pilas" en lo sucesivo, ya que últimamente he dilatado en exceso los intervalos de publicación, aún a pesar de que las estadísticas me demuestran que, más que usuarios asiduos y fieles, el perfil de los visitantes de este sitio se corresponde con personas que acceden, de forma significativamente mayoritaria, a través de buscadores (Google especialmente, como no podía ser de otra forma, al menos hoy por hoy) y metabuscadores, y de las correspondientes ecuaciones de búsqueda -algunas muy interesantes y sorprendentes, por cierto- cuyo análisis permite al tiempo establecer si existe una adecuada correspondencia entre los temas comúnmente tratados y las búsquedas equivalentes a esos temas por parte de los usuarios.

Bien, ahora toca aclarar el sentido y significado de la cita que de momento comparte protagonismo con la cabecera de la página: «Algorithm = Logic + Control». Esta "ecuación", de carácter muy general, ha hecho fortuna a la hora explicitar, de forma gráfica y condensada, los principios y fundamentos implícitos en el paradigma de la programación lógica (asociándose este esquema, de modo particular, con la programación lógica con restricciones), y en general en el análisis de los programas informáticos, y no es sino el título de un artículo en el que el autor, Robert Kowalski, explica su noción de la programación declarativa en general y lógica en particular, de desarrollo incipiente por los años en que fue publicado. La reseña completa de dicho artículo es la siguiente:

Kowalski, R. (1979), "Algorithm = logic + control", Communications of the ACM, 22 (7), pp. 424-436.
[referencia completa]

El texto completo, en formato PDF, está disponible en la biblioteca digital de la ACM, si bien el acceso está limitado a suscriptores de pago. Sí es de acceso libre la reseña, el resumen, y la bibliografía que acompañan al texto original. El artículo fue republicado posteriormente dentro de la obra Programming Languages: A Grand Tour (3ª edición, E. Horwitz ed., Computer Science Press: Maryland, 1986, pp. 480-492).

Al formular esta expresión, que viene a simbolizar, en forma de "ecuación", el paradigma de la programación lógica, Kowalski expresaba que en cualquier programa informático podemos distinguir dos aspectos constitutivos esenciales: lo que queremos que el programa haga (o parte lógica del programa, el qué) y la forma en que dicho programa debe resolver ese objetivo (el cómo, la parte de control). En este sentido, el paradigma de la programación lógica, y en general el paradigma de la programación declarativa (que engloba por una parte la programación funcional -Haskell, Lisp, etc.- y por otra la programación lógica), claramente se centra más en facilitar qué queremos que haga el programa -el objetivo prefijado de antemano-, que en cómo lo debe hacer para alcanzarlo, lo cual no excluye la existencia de poderosas estructuras de control como son las que vienen representadas, en el lenguaje Prolog, por los mecanismos de instanciación de variables, verificación y unificación de estructuras, recursividad y backtracking o retroceso, por citar los más importantes.

En el capítulo "La caja de Pandora A = L + C y sus variantes", página 84 y siguientes, de los apuntes de B. C. Ruiz Jiménez, Notas para la asignatura Programación Declarativa Avanzada (Universidad de Málaga, documento en formato PDF) se ofrece una buena explicación del significado e implicaciones de la fórmula de Kowalski. Por cierto, en este mismo documento se puede localizar una exposición muy clara de la sinergia y simbiosis que determinados proyectos aportan entre el paradigma de programación representado en parte por el lenguaje Prolog, y otra serie de enfoques (funcional, orientado a objetos, etc.), tal y como mencionábamos en la anterior anotación ("¿Programación lógica = Prolog?") a propósito de una referencia publicada en Lambda the Ultimate. Ver al respecto los apartados "Programación Lógica" e "Integración de los paradigmas lógico y funcional".

Retomando la explicación de la ecuación de Kowalski, interrumpida por la referencia del párrafo anterior, podemos decir que en Prolog, y dadas las características de este lenguaje de programación, el usuario se preocupa fundamentalmente de implementar la parte "lógica" de los programas (constituida esencialmente por la base de conocimiento, las reglas de inferencia, y las consultas), ya que los mecanismos de control que citábamos anteriormente, aquellos que determinan cómo el programa resolverá determinado objetivo, se implementan mediante una serie de algoritmos y mecanismos que funcionan a nivel interno, cuyas características últimas dependerán del intérprete utilizado (recordemos que Prolog es un lenguaje interpretado, si bien algunas implementaciones permiten compilar previamente determinadas instrucciones).

Surge en este punto, al asociar lógica con control, el planteamiento de la programación con restricciones o Constraint Programming a fin de aportar mayor control de evaluación o mecanismos de control, al esquema de la programación lógica y así hacer plenamente válida la máxima de Kowalski, dándose lugar de esta forma a la programación lógica con restricciones o Constraint Logic Programming (CLP). Algunos documentos sobre la programación con restricciones en general:

Constraint Programming (M. Wallace; también en formato PS; ver especialmente el apartado 2.1.1. Algorithm = Logic + Control).
Constraint Programming (notas de curso del profesor Jia-Huai You).
On-line guide to Constraint Programming (R. Barták, también autor de Guide to Prolog Programming).

Sobre la programación lógica con restricciones en particular ver por ejemplo los siguientes textos:

An Introductory Course on Constraint Logic Programming (M. Carro et al.).
Constraint Logic Programming - An Informal Introduction (T. Frühwirth et al.; formato PS).
Constraint Logic Programming: A Survey (J. Jaffar, M. J. Mayer; formato PS).
Constraint Logic Programming (D. Pountain en Byte.com).
Assessment of some issues in Computational Logic theory and program development or On a Pandora box called 'Algorithm = Logic + Control' (; en formato PDF; también en formato PS).
La Programación Lógica con Restricciones (P. Fernández Montes).
Programación Lógica Concurrente y Programación con Restricciones (C. J. Gálvez et al.; formato PDF).
La Programmation Logique et par Contraintes (L. Jean-Michel en Lambda Systems).

Algunas opiniones e interpretaciones al respecto de la "fórmula" que venimos comentando:

"The basic property of a declarative programming language is that a program is a theory in some suitable logic. This property immediately gives a precise meaning to programs written in the language. From a programmers point of the basic property is that programming is lifted to a higher level of abstraction. At this higher level of abstraction the programmer can concentrate on stating what is to be computed, not necessarily how it is to be computed. In Kowalski's terms where algorithm = logic + control, the programmer gives the logic but not necessarily the control."
Olof Torgersson en A Note on Declarative Programming Paradigms and the Future of Definitional Programming (el texto en HTML es una versión reducida del original en formato PS)

"The formula isn't precise, and it won't be precise until someone proposes a precise and generally accepted notion of how control is to be added to an expression of the logic of a program. Nevertheless, the idea is attractive, and I believe it can be made to work for some interesting class of programs. It is analogous to my comparison of epistemology and heuristics or Chomsky's competence and performance."
John McCarthy en Coloring Maps and the Kowalski Doctrine

En cualquier caso se ofrece una explicación bastante detallada de la expresión "Algorithm = Logic + Control", y su significado en relación con la programación lógica, en otro texto del propio Kowalski, Logic for Problem Solving (North-Holland Elsevier, 1979), concretamente en el capítulo 5, The Procedural Interpretation of Horn Clauses (en formato PDF; página 125 y siguientes, aunque en realidad el capítulo entero versa sobre esta cuestión). Los capítulos de este libro, de nivel muy asequible, y a texto completo, están disponibles en formato PDF, en la página personal de R. Kowalski, en la que además se encuentra una selección de su más reciente producción bibliográfica, así como los borradores de los capítulos preliminares del nuevo libro que está preparando, How to be Artificially Intelligent - the Logical Way, en el que se abordan los principios fundamentales de la lógica computacional, y su aplicación a los problemas de la vida cotidiana.

Finalizaremos resaltando que Kowalski es, junto con Alain Colmerauer, una de las figuras fundamentales en la creación y desarrollo de la programación lógica en general y del lenguaje Prolog en particular. Colmerauer, que desde finales de los años 60 del siglo pasado venía trabajando en el tratamiento y procesamiento del lenguaje natural mediante la aplicación de la lógica computacional, toma contacto con Kowalski en 1971 al interesarse por sus trabajos en relación con la demostración automática de teoremas (theorem proving) y el método de resolución SL (SL-resolution), y fruto de esta colaboración se produce el primer desarrollo efectivo del lenguaje de programación lógica Prolog. Todo este proceso, junto con otras notas autobiográficas, es explicado brevemente por el mismo Kowalski en el texto A Short Story of My Life and Work.

¿Programación lógica = Prolog?

2004-03-29T12:59:00.000+02:00

La referencia al tutorial "The Logic Programming Paradigm and Prolog" de K. R. Apt (Universidad de Amsterdam, documento en formato PS; realmente se trata del capítulo 15 del libro "Concepts in Programming Languages"), está suscitando en Lambda the Ultimate interesantes comentarios que conviene no perderse por parte de las personas interesadas en este lenguaje de programación, y en la programación lógica en general. Así por ejemplo, Peter Van Roy, de la Universidad Católica de Lovaina (Bélgica), destacado investigador de implementaciones de lenguajes de programación en los dominios de la programación declarativa, lógica, y con restricciones, entre otros, critica -en una clara referencia al propio Apt- el, en su opinión, excesivo "ensimismamiento" de algunos programadores...

"[...] There is a certain class of logic programmers who choose to ignore anything that does not fit into the cosy little world of Prolog-style logic programming."
[Fuente]

...interesados casi en exclusiva en el paradigma de la programación lógica cuando éste se circunscribe a Prolog y otros lenguajes muy similares (de tal forma que llegan a asumir implícitamente la ecuación programación lógica = Prolog), sin tener en consideración otras líneas de desarrollo e investigación que, tomando como base los fundamentos y aportaciones de dicho paradigma, tratan de complementar las carencias y limitaciones del lenguaje Prolog "puro" a la hora de representar y resolver ciertos problemas y planteamientos computacionales. Como ejemplo de las mencionadas líneas alternativas de desarrollo de novedosos sistemas de programación, "emparentados" o relacionados hasta cierto punto con el paradigma de la programación lógica, podemos citar el proyecto Mercury, el sistema de programación Mozart, el lenguaje lógico/funcional Curry, etc., etc.

Muy interesante también el comentario de N. Krishnaswami, que en respuesta a la pregunta de otro participante, explica sucintamente, con un ejemplo, en qué consiste la programación con restricciones [1] [2] o constraint programming (CP), que en el paradigma lógico/declarativo da lugar a la programación lógica con restricciones o Constraint Logic Programming (CLP).

La discusión, en los términos que mencionábamos al comienzo de esta anotación, planteados por Peter Van Roy, por supuesto continúa en el hilo de la referencia hecha en Lambda the Ultimate, por lo que no puedo sino recomendar la lectura de los nuevos comentarios que se van suscitando a raíz de los anteriores.

El "spam" como metáfora de un organismo vivo

2004-03-03T12:35:00.000+01:00

Interesante artículo en el portal Generation5: "Application of Biological Metaphors for Identifying and Killing Spam" (S. Evans). ¿el tema? creación de un filtro anti-spam utilizando técnicas de Redes Neuronales Artificiales (RNA, Artificial Neural Networks). Como introducción y argumento teórico, el autor realiza una curiosa analogía, el fenómeno del spam como un ser vivo (Spam as a Living Organism), en constante evolución y adaptación al "medio" (en este caso el correo electrónico y sus formatos y medios de transmisión a través de Internet), regido por leyes propias de "adaptación natural".

Complete with C# source code, this article looks at how to identify spam using a variety of biological metaphors such as neural networks.
[fuente]

El artículo incluye el código fuente de dicho filtro, descargable en un archivo comprimido, y desarrollado en lenguaje C#. Como todas las RNA, este código necesita de un entrenamiento previo para funcionar correctamente, como se explica en el texto (Training the Networks). En el apartado de resultados, se nos informa de que, en las pruebas realizadas, se ha obtenido un solo fallo sobre 1000 correos analizados.

En otro orden de asuntos, no muy alejados en todo caso, y también en Generation5, se publico hace ya varias semanas otro artículo que me gustaría destacar: "Intelligence - Artificial and Otherwise" (Bruce L. Toy):

This paper presents a model of artificial intelligence, based on an XML memory structure, a logic architecture of divisible processor functions, and real-time sensor integration. It incorporates learning, consciousness, creativity, and growth in a framework that can be used to understand human behavior, build an independent intelligent entity, or integrate a large-scale computer network into an intelligent system.
[fuente]

La utilización de XML para implementar la estructura de memoria del modelo de trabajo, basado en técnicas de IA, que se describe en el texto, viene derivada de la intención de dotar a dicho modelo de la capacidad de soportar funcionalidades web. Dado que el resumen del artículo que acabamos de reproducir es suficientemente claro y expresivo, creo que no cabe añadir nada más al respecto, salvo recomendar su lectura.

Una introducción a Prolog ¿para "Hackers"...?

2004-03-02T01:11:00.000+01:00

A través de pjorge, me entero de la reciente publicación de A Prolog Introduction for Hackers. De paso la referencia me ha servido para conocer Kuro5hin.org: "...collaborative site about technology and culture, both separately and in their interactions." (fuente).

A pesar de lo que el título pueda dar a entender, "A Prolog Introduction..." es simplemente una introducción a este lenguaje, de carácter muy general, por lo que no acabo de entender que pintan los "hackers" en el asunto... seguramente, como me apuntaba Ander de Donosti.org, algo de esto debe de haber en tan incomprensible mención... De carácter general y breve, repito, aunque al tiempo de exposición suficientemente clara y completa, este pequeño tutorial es sin embargo bastante adecuado para quienes apenas conozcan algo (o nada) del lenguaje Prolog y estén interesados en adquirir unas nociones básicas. Quizás se hecha en falta una mención más extensa de procedimientos esenciales como son el corte, la negación, las técnicas recursivas y de parámetros acumuladores, la utilización de predicados dinámicos, etc.

También son de lectura muy recomendable los numerosos comentarios suscitados a propósito de este pequeño tutorial (más de 100 en el momento de escribir estas líneas), destacando especialmente, a mi modo de ver, el que lleva por título "Benefits of the Prolog mindset...", pero en fin, conviene no perderse ninguno; muchos de ellos son simples críticas, más o menos fundamentadas, en torno a los méritos o deméritos del lenguaje Prolog, si bien en otros casos se trata de aportaciones adicionales, muy pertinentes, en torno a cuestiones poco o nada tratadas en el tutorial que venimos comentando, o que simplemente informan de recursos interesantes relacionados con dicho lenguaje.

A su vez, en los comentarios a la anotación de pjorge, JJ da una opinión un tanto sorprendente, y a mi juicio prejuiciosa y equivocada, acerca del lenguaje Prolog, que en cualquier caso es contestada con gran acierto por Akuma...

En Lambda the Ultimate también hacen referencia al tutorial "A Prolog Introduction...", e igualmente, en el apartado de comentarios se pueden leer opiniones interesantes. Destacar que Peter Van Roy, en dichos comentarios, hace algunas correcciones a fallos evidentes contenidos en el texto de la introducción que venimos comentando.

Finalizamos reseñando varios tutoriales, apuntes e introducciones al lenguaje Prolog. En algunos casos se trata de ediciones electrónicas de monografías dedicadas a este lenguaje de programación lógica. El orden de la mención es aleatorio, no implica ningún tipo de escala de importancia ni nada parecido:

En castellano

Introducción a la Lógica Matemática - Lógica Matemática y Aplicaciones (S. V. Chapa Vergara).
Introducción al Prolog (J. Suárez Sanz).
Programación Lógica (V. Iniestra).
Representación del conocimiento en sistemas inteligentes (G. Fernández Fernández).
Representación de Conocimiento (E. Morales, L. E. Sucar).
Tutorial de Prolog (traducción parcial del manual del sistema DECsystem-10 Prolog).
Tutoriales de Prolog en Programación en castellano (A. Fernández Pineda).
Guía de estilo de programación en Prolog (P. R. Borges).
Introducción al Prolog.
Programación lógica en Prolog (por Wintermute).
Prolog (M. Salas Zúñiga, E. Uraga Serratos).
Introducción al Prolog (J. R. Portillo).

En inglés

A Concise Introduction to Prolog (D. Matuszek; otra ubicación).
Adventure in Prolog (en Amzi.com).
Building Expert Systems in Prolog (D. Merritt; idem).
An Introduction to Prolog (L. Michel, V. Nicolas).
An Introduction to SICStus Prolog (R. Dearden).
Basics of Prolog (A. Cawsey).
C-Prolog User's Manual (F. Pereira et al.).
Databases and Artificial Intelligence (A. Cawsey).
GNU-Prolog Manual (D. Diaz).
Guide to Prolog Programming (R. Barták).
Haskell and Prolog Datatypes - Haskell/Prolog Differences.
Prolog Introduction (L. Allison).
Introduction to Prolog for Mathematicians (J. Paine; otra ubicación).
Introduction to Prolog (J. Hodgson).
iProlog Programmer's Manual (C. Sammut; otra ubicación).
Introductory Course on Constraint Logic Programming (M. Carro et al.).
Declarative Programming: The Prolog Language (W. Kreutzer).
Learn Prolog Now! (P. Blackburn et al.).
Learning Prolog (N. Ford).
An Introduction to Prolog (A. C. Brett).
Logic Programming Course (otra ubicación).
Artículos e introducciones sobre Prolog en Generation5.
More Prolog (D. R. Tveter).
Programming in Schelog -embedding of Prolog-style logic programming in Scheme (D. Sitaram).
Programming in Tabled Prolog (David S. Warren).
Prolog Basics: A Guide For Beginners (T. Drapkin).
Introduction to Prolog (D. Nichols).
Prolog for Software Engineering (Peter B. Reintjes).
Prolog Tutorial (A. Aaby).
Prolog and Logic Programming (P. J. Hancox; otra ubicación).
Prolog Tutorials (J. Power).
Prolog Tutorials (A. Monaghan).
Visual Prolog On-line Tutorials.
Prolog Tutorial (J. R. Fisher).
Prolog Programming A First Course (P. Brna).
Quick Prolog (D. S. Robertson).
SICStus Prolog User's Manual.
Solving combinatoric problems with Prolog.
The Prolog Dictionary (B. Wilson).
Trinc-Prolog Help Index.
Prolog (en Wikipedia).
Using SWI-Prolog (S. Harlow).
SWI-Prolog Reference Manual.
Online Teaching Material - Prolog (P. W. Goldberg).

Monografías

An Introduction to Logic Programming through Prolog (J. M. Spivey).
Artificial Intelligence through Prolog (Neil C. Rowe).
Natural Language Processing in Prolog (G. Gazdar, C. Mellish; otra ubicación).
Artificial Intelligence Through Search (C. Thorton, B. du Boulay).
Logic for Computer Science: Foundations of Automatic Theorem Proving (J. Gallier).
Logic, Programming and Prolog (U. Nilsson, J. Maluszynski).
Prolog and Natural-Language Analysis (F. C. N. Pereira, S. M. Shieber).
Prolog Parsers. Parsing techniques in Prolog (Klaus von Bremen).
Clause and Effect: Prolog programming for the Working Programmer (W. F. Clocksin; en PDF; también en PS).
Logic for Problem Solving (R. Kowalski).

En otros idiomas

La Programmation Logique et le langage Prolog (P. Nugues).
Introduction à Prolog (C. Solnon).
Manuale Prolog (G. Adorni et al.).
Méta Interpréteurs en Prolog (L. Jean-Michel).
Tutorial de Prolog (Claudio Cesar de Sá).
Zur Entstehung der Programmiersprache Prolog (D. Schmitt).
Introdução à Programação Prolog (Luiz A. M. Palazzo).

No se trata en absoluto de un listado completo de todo lo que se puede localizar en Internet sobre este lenguaje. En inglés, y también en castellano, se encuentran bastantes apuntes y notas de curso correspondientes a asignaturas universitarias, por lo general de calidad y profundidad de análisis bastante superiores a las que encontramos en las introducciones y tutoriales que acabamos de mencionar, si bien su referencia la dejamos para más adelante.

Un nuevo "blog" y clasificaciones facetadas a propósito de Nedstat

2004-02-22T02:36:00.000+01:00

Por medio de los "referred" (referidos) de las estadísticas, me entero de la existencia de Sense of Wonder, weblog escrito en inglés por David Cerezo, que la verdad sea dicha tiene muy buena pinta, tanto en la presentación como en los contenidos, que en definitiva viene a ser lo importante. Problemas fundamentales de la teoría de la computación, lenguajes de programación, representación del conocimiento... son, a grandes rasgos, algunos de los temas tratados de momento, complementados por prometedores apartados como el que encontramos en la columna de la derecha bajo el epígrafe "Worth reading documents", selección de documentos relevantes de temática variada.

Por cierto, y ya que hemos mencionado el sistema de estadísticas, es muy curiosa y expresiva, muy "semántica", la identificación que hace Nedstat de los apartados en que divide la información que ofrece, a saber: "Aquí y ahora", "Cuándo", "De dónde", "Cómo", "Con qué"... Sin duda se trata de una forma de clasificación, de organización facetada de la información, que recuerda a las cinco facetas significativas o fundamentales de la Clasificación Colonada ("Colon Classification") de Ranghanatan: Personalidad, Materia, Energía, Espacio y Tiempo. Éstas permiten agrupar la información en "campos semánticos", determinados por una serie de afinidades y características comunes.

Ranganathan consideraba el mundo como un conjunto de entidades variables, descomponibles en puntos de vista o facetas, que son los términos normalizados, utilizados para clasificar las materias, que acabamos de enumerar:

Personalidad: es el primer orden clasificatorio, el objeto principal de cada materia y por ello el órden más activo.
Materia: aspectos, propiedades, cualidades, elementos materiales.
Energía: acciones, procedimientos, técnicas.
Espacio: lugar en el que sucede un hecho.
Tiempo: toda realidad es contemplable desde una localización en el tiempo.

Los sistemas facetados se basan en el análisis y descomposición de las materias en sus partes componentes, y la unión de esas partes de acuerdo con el documento que se va a representar. Implican por tanto un proceso de análisis y de síntesis, que toma en consideración la individualidad de cada documento, y permite un elevado grado de autonomía en la toma de decisiones a la hora de clasificarlos.

Podemos destacar las siguientes ventajas de las clasificaciones facetadas:

Las divisiones en facetas constituyen medios originales para canalizar las materias y los conocimientos.
Permiten explicar conceptos con mayor precisión que los sistemas enumerativos (aquellos que listan, relacionan, y enumeran todas las materias con carácter lineal, dividiendo las disciplinas en clases de niveles jerárquicos diferenciados, descendiendo en especificidad), a partir de un número de elementos menor. Las facetas tienen una alta capacidad combinatoria, partiendo de pocos elementos iniciales.
Los sistemas facetados se prestan bien a la automatización, ya que una materia se puede localizar a partir de cada una de las facetas con las que halla sido descrita, incidiendo de esta forma en ciertos aspectos de la postcoordinación (en los lenguajes documentales postcoordinados los términos de la descripción se utilizan libremente, sin relación a priori entre ellos, estableciéndose esa relación en el momento de la recuperación del documento).
Tienen una gran capacidad para integrar nuevos conceptos. Se pueden introducir modificaciones en una faceta dentro de un área determinada sin que afecte a las restantes.

Sin embargo:

Los sistemas facetados tienen una estructura, para cada materia concreta, con niveles jerárquicos menos definidos que la equivalente en las clasificaciones de carácter enumerativo.
Las notaciones resultantes son a menudo complicadas y difíciles de memorizar, al estar adaptadas expresamente a cada documento en particular.
La responsabilidad de las descripciones recae siempre sobre la competencia del clasificador, mientras que en los sistemas enumerativos ésta se presenta resuelta en las tablas.

En cualquier caso el sistema clasificatorio facetado desarrollado por Ranganathan, supuso un importante avance teórico, de decisiva influencia en los posteriores sistemas de clasificación de carácter combinatorio y en los modernos tesauros.