<$BlogRSDUrl$>

Pro·Log·[IR]

Programación Lógica y Recuperación de Información

«Algorithm = Logic + Control» Robert Kowalski (1979)

¡Importante! esta página hace uso de estilos recogidos en la especificación CSS2, no soportados por el navegador que está utilizando. Por favor, lea esta recomendación al respecto.

Archivo

Guardado por meses.

Enlaces

Los siguientes listados son una referencia a partir de la cual ampliar la búsqueda de sitios relacionados (i).

Bitácoras en castellano

Bitácoras en inglés

Directorios, metablogs

Programación lógica, Inteligencia Artificial, Recuperación de Información

Usabilidad, Arquitectura de la Información

Listas, foros, wikis

Matemáticas, ciencias

Miscelánea

Búsquedas

Búsqueda simple en varios de los motores más conocidos. Para mayor precisión, entrar en la página correspondiente e ir al apartado de búsqueda avanzada.

Búsqueda con Google
 

Búsqueda con Yahoo!
 

Búsqueda con AlltheWeb

Varios

Esta página traducida:

Traducción al catalán, internostrum; traducción al portugués, universia.

Reciba un aviso de nuevos comentarios (por Bloglet).


Agregue este sitio a su lector de "feeds" (sindicación mediante el sistema Atom).

Sobre este sitio

Espacio dedicado a la programación lógica y la recuperación de información, con una atención especial al lenguaje Prolog y otros lenguajes afines, pertenecientes al paradigma lógico y declarativo. También se tratará de hablar de estos temas desde la perspectiva de la Biblioteconomía y la Documentación.

En esta página

23.11.03

NLTK: Procesamiento del Lenguaje Natural con Python

Las personas interesadas en la aplicación del lenguaje multiplataforma de script Python [1] [2] [3], al procesamiento del lenguaje natural (PLN o NLP), pueden encontrar en Natural Language Toolkit (NLTK) un conjunto de herramientas de desarrollo, de uso libre, de gran interés y potencial. Este "kit" está formado por varias librerías o módulos, implementados en dicho lenguaje, y orientados a la manipulación de los diversos aspectos involucrados en el PLN: tokenización, parsing, clasificación, gramáticas libres de contexto (CFG), representación y procesamiento de información probabilística, visualización gráfica de estructuras y procesos del lenguaje, expresiones regulares, lenguajes formales y autómatas de estados finitos (FSM, un modelo teórico de representación de estados en número finito o forma simplificada y sencilla de modelar lenguajes naturales; ejemplo de máquina de estados representada en Prolog), etc.

"NLTK [...] is a suite of Python libraries and programs for symbolic and statistical natural language processing. [...] includes graphical demonstrations and sample data. It is accompanied by extensive documentation, including tutorials that explain the underlying concepts behind the language processing tasks supported by the toolkit.

[...] is ideally suited to students who are learning NLP or conducting research in NLP or closely related areas, including empirical linguistics, cognitive science, artificial intelligence, information retrieval, and machine learning. NLTK has been used successfully as a teaching tool, as an individual study tool, and as a platform for prototyping and building research systems."

NLTK forma parte de un conjunto más amplio de proyectos relacionados con el PLN y en general con la lingüística computacional, agrupados bajo la denominación genérica OpenNLP a fin de adquirir una cierta consistencia y coordinación entre ellos (ver al respecto el documento "About"):

"OpenNLP provides the organizational structure for coordinating several different projects which approach some aspect of Natural Language Processing. [...] also defines a set of Java interfaces and implements some basic infrastructure for NLP components."

En la página del proyecto NLTK, de aplicación inicialmente orientada a la labor docente y de investigación llevada a cabo en cursos universitarios relacionados con técnicas de PLN, está disponible numerosa documentación (tutoriales, documentación de la API, informes técnicos, artículos, etc.), existiendo además una lista de correo para estar al tanto de las últimas novedades al respecto, así como otros canales de colaboración y ayuda.

Mencionaremos por último, a modo de ejemplo de aplicaciones referidas al PLN, otra interesante herramienta, HDRUG (Gertjan van Noord, Universidad de Groningen, Holanda), entorno gráfico de usuario para el desarrollo de gramáticas lógicas, parser y generadores para el manejo del lenguaje natural. Este paquete de herramientas está escrito para su ejecución en el entorno Sicstus Prolog (básicamente una implementación de ISO Prolog, con extensiones adicionales; no es de uso gratuito, aunque se puede obtener una copia de evaluación, previa petición) y si bien parece un proyecto algo desactualizado, tiene el interés de mostrar la materialización práctica de una plataforma de PLN, utilizando el lenguaje Prolog en la parte referida al motor lógico y de inferencia y la base de conocimientos.

Por otro lado, Gertjan van Noord es también autor de otros interesantes programas, la mayor parte relacionados con diversos aspectos del PLN, entre otros:

La interfaz gráfica de las herramientas HDRUG y FSA Utilities está resuelta mediante Tcl/Tk (ver los enlaces que sobre este paquete para el desarrollo de GUI's, soportado por la implementación Sicstus Prolog, se referenciaron en una anterior anotación).

[0] comentarios | # | lista |


Pro·Log·[IR],

Publicación: Blogger | Estadísticas: eXTReMe Tracking

Se recomienda ver este sitio con Mozilla 1+, Firefox 0.8+ ó Netscape 7+. Si no queda más remedio, con IE 6+. Si lo desea, comunique cualquier problema al respecto. También será bien recibida cualquier sugerencia sobre el contenido. La fuente de letra preferente es Georgia. Se prohibe la utilización del diseño de la página salvo autorización expresa del autor. Los contenidos escritos son de uso libre, siempre que se cite la fuente.