Universidad de Costa Rica > Vicerrectoría de Investigación > INIL > La Lingüística > Centros de Recursos Lingüísticos > Recursos en la web
Recursos en la web
Difusión Lingüística
Título Descripción Enlace
Humans Who Read Grammars Blog dedicado a la variedad y la descripción de más de 7000 lenguas del mundo http://humans-who-read-grammars.blogspot.com/
GeLaToGenomes and Languages Together Base de datos lingüísticos vinculados con datos genómicos https://gelato.clld.org/
Recursos Técnicos
Anotación de Corpus
Título | Descripción | Enlace |
---|---|---|
Phonological CorpusTools | Herramienta especializada en el manejo de corpus fonológicos. Tiene dos interfaces: una gráfica y otra de línea de comando. | http://phonologicalcorpustools.github.io/CorpusTools/ |
UAM CorpusTool | Herramienta para la anotación de corpus textuales. | http://www.corpustool.com/ |
MMAX2 | Herramienta flexible de anotación de corpus, especialmente apta para anotar relaciones a nivel de discurso. | http://mmax2.net/index.html |
Estadística y Manejo de Datos
Título | Descripción | Enlace |
---|---|---|
R | Lenguaje de análisis estadístico y visualización de datos. | http://www.r-project.org/ |
Weka | Software en Java para clasificación (regresiones, SVM, etc.). | https://www.cs.waikato.ac.nz/ml/weka/ |
Fonética y Fonología
Título | Descripción | Enlace |
---|---|---|
Praat | Software de análisis fonético. | http://www.fon.hum.uva.nl/praat/ |
Phonological CorpusTools | Herramienta especializada en el manejo de corpus fonológicos. Tiene dos interfaces: una gráfica y otra de línea de comando. | http://phonologicalcorpustools.github.io/CorpusTools/ |
TypeIt | Teclado para símbolos fonéticos. | http://ipa.typeit.org/ |
PHOIBLE 2.0 | Repositorio lingüístico de datos fonológicos extraídos de fuentes documentales y bases de datos terciarias. | https://phoible.org/ |
Herramientas de Procesamiento de Lenguaje Natural
Título | Descripción | Enlace |
---|---|---|
Etiquetador morfológico bribri | Parser morfológico para la lengua bribri. | http://morphology.bribri.net/ |
NLTK - Natural Language Processing Toolkit | Librería de Python con gran variedad de herramientas de procesamiento de texto, como parsers, tokenizadores, etc. Incluye interfaces a herramientas como Wordnet y diferentes corpora. | http://www.nltk.org/ |
Stanford CoreNLP | Toolkit con herramientas del state-of-the-art en parsing, resolución de correferencias, PoS-tagging, entre muchas otras.especialmente apta para anotar relaciones a nivel de discurso. | https://stanfordnlp.github.io/CoreNLP/ |
Gensim | Librería de python para vectorización (word2vec, etc.) y análisis semántico. | https://radimrehurek.com/gensim/ |
Pytorch | Librería de python para deep learning. | https://pytorch.org/ |
AntConc | Parser para el análisis de concordancias y textos | https://www.laurenceanthony.net/software/antconc/ |
Sketch Engine | Parser para el análisis de palabras en un corpus | https://www.sketchengine.eu/ |
Linguakit | Herramienta empleada para análisis lingüístico y textual | https://linguakit.com/es/analisis-completo |
Herramientas de la Biblioteca Virtual Miguel de Cervantes
Título | Descripción | Enlace |
---|---|---|
Análisis de investigadores en el portal de Teatro clásico español | Esta herramienta permite la visualización y análisis de los investigadores en autores de teatro clásico español. | https://data.cervantesvirtual.com/investigadores-teatro-clasico-espanol |
Analizador de versos | Herramienta que realiza el escaneo automatizado de poesía española con la librería Rantanplan basada en SpaCy y desarrollada por LINDH. | https://data.cervantesvirtual.com/versos |
Analizador morfológico | Parser morfosintáctico para el español que utiliza la librería de Stanford CoreNLP para realizar el análisis de forma automática. | https://data.cervantesvirtual.com/analizador |
Buscador de datos enlazados (FRBR-RDA) | Herramienta para consultar los autores y obras del repositorio de datos enlazados. | https://data.cervantesvirtual.com/search-form |
Buscador diacrónico | Este corpus contiene 86 obras de la Biblioteca Virtual Miguel de Cervantes, publicadas entre 1482 y 1627, cubriendo una gran variedad de autores y géneros. | https://data.cervantesvirtual.com/diasearch |
Buscador geográfico | El buscador geográficos de obras permite obtener localizaciones geográficas por su nombre, consultando diferentes fuentes (DBpedia y GeoNames) conforme a los criterios seleccionados. | https://data.cervantesvirtual.com/geosearch |
Corpus de sonetos del Siglo de Oro | Corpus conformado por los sonetos escritos en castellano entre los siglos XVI y XVII del catálogo de obras de la Biblioteca Virtual Miguel de Cervantes | https://data.cervantesvirtual.com/goldenage |
Editor de consultas SPARQL | Catálogo realizado con el lenguaje de búsqueda SPARQL. | https://data.cervantesvirtual.com/sparql |
Generador de resúmenes | Herramienta que permite introducir un texto y obtener un resumen. | https://data.cervantesvirtual.com/generador-resumenes |
Visualización de Árboles Sintácticos
Título | Descripción | Enlace |
---|---|---|
phpSyntaxTree | Visualizador de árboles sintácticos. | http://ironcreek.net/phpsyntaxtree/ |
Visualización de Corpus
Título | Descripción | Enlace |
---|---|---|
Annotation of Information Structure (ANNIS) | Visualizador de corpora que puede ser utilizado localmente o alojarse en un servidor. | http://corpus-tools.org/annis/documentation.html |
NoSketch Engine | Software libre de manejo de corpus. | https://nlp.fi.muni.cz/trac/noske |
WoPoss | Herramienta para visualizaciones gráficas de significados, conceptos y funciones (en su evolución diacrónica), utilizando un corpus latino del período del s. III a.C. al s. VII d.C. | https://woposs.unine.ch/pygmalion.php |
Corpus y bases de datos
Título | Descripción | Enlace |
---|---|---|
Corpus LAELE Nebrija | Compilación de corpus personalizables para el estudio de fenómenos lingüísticos | https://www.corpusnebrija.proyectoemilia.es/corpus/ |
CODES | Corpus especializado en el estudio de la descortesía afiliativa en distintos medios de comunicación. | https://codescorpus.wordpress.com/ |
OccOr-es | Corpus diacrónico que reúne textos redactados o publicados en lengua española entre 1850 y 1939 sobre temas relacionados con Asia oriental. | https://dh.dlls.univr.it/corpora/occores/ |
DIACOM-es | Corpus diacrónico especializado que reúne textos de ámbito comercial (temporal, geográfico y funcional), en lengua española. | https://dh.dlls.univr.it/corpora/diacomes/ |
Glottolog 5.1 | Base de datos referencial e informativa sobre las lenguas alrededor del mundo, especializado en las menos conocidas. | https://glottolog.org/ |
APiCS Online | Base de datos provista de 130 rasgos gramaticales y léxicos de 76 lenguas "pidgin" y criollas alrededor del mundo. | https://apics-online.info/ |
AILLA | Repositorio trilingüe [inglés, español, portugués] de grabaciones, textos y otros materiales multimedias referente a las lenguas indígenes latinoamericanas. | https://ailla.utexas.org/ |
Clasificación y tipología de lenguas
Título | Descripción | Enlace |
---|---|---|
Ethnologue | Catálogo en línea de referencia y tipología lingüística para el estudio de las lenguas alrededor del mundo. | https://www.ethnologue.com/ |
WALS | Base de datos para el estudio de propiedades estructurales de diversas lenguas, recopiladas a partir de fuentes descriptivas. | https://wals.info/ |