Universidad de Costa Rica > Vicerrectoría de Investigación > INIL > La Lingüística > Centros de Recursos Lingüísticos > Recursos en la web
Recursos en la web
Difusión Lingüística
Título Descripción Enlace
Humans Who Read Grammars Blog dedicado a la variedad y la descripción de más de 7000 lenguas del mundo http://humans-who-read-grammars.blogspot.com/
GeLaToGenomes and Languages Together Base de datos lingüísticos vinculados con datos genómicos https://www.comparativelinguistics.uzh.ch/en/DLL/Databases/GeLaTo.html
Recursos Técnicos
Anotación de Corpus
Título | Descripción | Enlace |
---|---|---|
Phonological CorpusTools | Herramienta especializada en el manejo de corpus fonológicos. Tiene dos interfaces: una gráfica y otra de línea de comando. | http://phonologicalcorpustools.github.io/CorpusTools/ |
UAM CorpusTool | Herramienta para la anotación de corpus textuales. | http://www.corpustool.com/ |
MMAX2 | Herramienta flexible de anotación de corpus, especialmente apta para anotar relaciones a nivel de discurso. | http://mmax2.net/index.html |
Estadística y Manejo de Datos
Título | Descripción | Enlace |
---|---|---|
R | Lenguaje de análisis estadístico y visualización de datos. | http://www.r-project.org/ |
Weka | Software en Java para clasificación (regresiones, SVM, etc.). | https://www.cs.waikato.ac.nz/ml/weka/ |
Fonética y Fonología
Título | Descripción | Enlace |
---|---|---|
Praat | Software de análisis fonético. | http://www.fon.hum.uva.nl/praat/ |
Phonological CorpusTools | Herramienta especializada en el manejo de corpus fonológicos. Tiene dos interfaces: una gráfica y otra de línea de comando. | http://phonologicalcorpustools.github.io/CorpusTools/ |
TypeIt | Teclado para símbolos fonéticos. | http://ipa.typeit.org/ |
Herramientas de Procesamiento de Lenguaje Natural
Título | Descripción | Enlace |
---|---|---|
Etiquetador morfológico bribri | Parser morfológico para la lengua bribri. | http://morphology.bribri.net/ |
NLTK - Natural Language Processing Toolkit | Librería de Python con gran variedad de herramientas de procesamiento de texto, como parsers, tokenizadores, etc. Incluye interfaces a herramientas como Wordnet y diferentes corpora. | http://www.nltk.org/ |
Stanford CoreNLP | Toolkit con herramientas del state-of-the-art en parsing, resolución de correferencias, PoS-tagging, entre muchas otras.especialmente apta para anotar relaciones a nivel de discurso. | https://stanfordnlp.github.io/CoreNLP/ |
FIPS | Parser sintáctico del Laboratoire d'Analyse et de Technologie du Langage de la Universidad de Ginebra. | http://www.latl.unige.ch/ |
Gensim | Librería de python para vectorización (word2vec, etc.) y análisis semántico. | https://radimrehurek.com/gensim/ |
Pytorch | Librería de python para deep learning. | https://pytorch.org/ |
Herramientas de la Biblioteca Virtual Miguel de Cervantes
Título | Descripción | Enlace |
---|---|---|
Análisis de investigadores en el portal de Teatro clásico español | Esta herramienta permite la visualización y análisis de los investigadores en autores de teatro clásico español. | https://data.cervantesvirtual.com/investigadores-teatro-clasico-espanol |
Analizador de versos | Herramienta que realiza el escaneo automatizado de poesía española con la librería Rantanplan basada en SpaCy y desarrollada por LINDH. | https://data.cervantesvirtual.com/versos |
Analizador morfológico | Parser morfosintáctico para el español que utiliza la librería de Stanford CoreNLP para realizar el análisis de forma automática. | https://data.cervantesvirtual.com/analizador |
Buscador de datos enlazados (FRBR-RDA) | Herramienta para consultar los autores y obras del repositorio de datos enlazados. | https://data.cervantesvirtual.com/search-form |
Buscador diacrónico | Este corpus contiene 86 obras de la Biblioteca Virtual Miguel de Cervantes, publicadas entre 1482 y 1627, cubriendo una gran variedad de autores y géneros. | https://data.cervantesvirtual.com/diasearch |
Buscador geográfico | El buscador geográficos de obras permite obtener localizaciones geográficas por su nombre, consultando diferentes fuentes (DBpedia y GeoNames) conforme a los criterios seleccionados. | https://data.cervantesvirtual.com/geosearch |
Corpus de sonetos del Siglo de Oro | Corpus conformado por los sonetos escritos en castellano entre los siglos XVI y XVII del catálogo de obras de la Biblioteca Virtual Miguel de Cervantes | https://data.cervantesvirtual.com/goldenage |
Editor de consultas SPARQL | Catálogo realizado con el lenguaje de búsqueda SPARQL. | https://data.cervantesvirtual.com/sparql |
Generador de resúmenes | Herramienta que permite introducir un texto y obtener un resumen. | https://data.cervantesvirtual.com/generador-resumenes |
Visualización de Árboles Sintácticos
Título | Descripción | Enlace |
---|---|---|
phpSyntaxTree | Visualizador de árboles sintácticos. | http://ironcreek.net/phpsyntaxtree/ |
Visualización de Corpus
Título | Descripción | Enlace |
---|---|---|
Annotation of Information Structure (ANNIS) | Visualizador de corpora que puede ser utilizado localmente o alojarse en un servidor. | http://corpus-tools.org/annis/documentation.html |
Grial | Léxico verbal del corpus SenSem. | http://grial.edu.es/sensem/lexico/main |
NoSketch Engine | Software libre de manejo de corpus. | https://nlp.fi.muni.cz/trac/noske |