Centro de Recursos

Corpus Lingüísticos

TítuloDescripciónEnlace
CLIPP-CO (Corpus Lingüístico de Publicaciones Periódicas de Costa Rica)1.5m palabras. Requiere cuenta.http://corpus.ucr.ac.cr/
Corpus Digital de Mensajes Presidenciales de Costa Rica (CODIMEP-CR)Corpus de mensajes presidenciales costarricenses desde el siglo XIX hasta la actualidad.https://sites.google.com/site/mensajepresidencialcr/
IPROCOLDITreebank basado en el CODIMEP-CR.https://sites.google.com/site/iprocolditreebank/Downhome/siglo-xix
Corpus pandialectal oral de la lengua bribriDocumentos multimedia anotados morfológicamente.http://www.bribri.net/

Lenguas Indígenas

TítuloDescripciónEnlace
Curso de Bribri IContiene materiales escritos y orales para el aprendizaje del bribri.http://inil.ucr.ac.cr/recursos/materiales-del-curso-bribri/
Corpus pandialectal oral de la lengua bribriDocumentos multimedia anotados morfológicamente.http://www.bribri.net/
Estudios de Lingüística Chibcha Revista de la UCR sobre lingüística chibcha.https://revistas.ucr.ac.cr/index.php/chibcha
Etiquetador morfológico bribriParser morfológico para la lengua bribri. http://morphology.bribri.net/
Teclado chibchaTeclado adecuado para la escritura de lenguas chibcha.http://inil.ucr.ac.cr/recursos/teclado-chibcha/
Lenguabribri.comGran cantidad de materiales didácticos e informativos sobre la lengua bribri.https://www.lenguabribri.com/p%C3%A1gina-principal

Recursos Bibliográficos

TítuloDescripciónEnlace
Publicaciones Costarricenses en Procesamiento del Lenguaje NaturalColección de artículos publicacados en Costa Rica o por costarricenses sobre temas de lingüística computacional y NLP.http://inil.ucr.ac.cr/wp-content/uploads/2019/01/Trabajos-NLP-Costa-Rica2.pdf
Diagnóstico de la investigación lingüística en la UCR.Bibliografía generada por investigadores del INIL y estudiantes del Posgrado en Lingüística. Impacto de la investigación en la docencia. Bibliografía , Informe completo
Biblioteca de Lingüística de América CentralColección de textos digitalizados sobre gramática española y de lenguas indígenas.https://inil.ucr.ac.cr/publicaciones/biblioteca-de-linguistica-de-america-central/
Estudios de Lingüística Chibcha Revista de la UCR sobre lingüística chibcha.https://revistas.ucr.ac.cr/index.php/chibcha
KáñinaRevista de Artes y Letras de acceso abierto de la UCR.https://revistas.ucr.ac.cr/index.php/kanina
Language Science PressGran cantidad de libros en lingüística de libre acceso.http://langsci-press.org/catalog
Publicaciones en lingüística computacional de investigadores del INILhttp://inil.ucr.ac.cr/publicaciones/linguistica-computacional/
Revista de Filología y Lingüística de la Universidad de Costa RicaRevista de lingüística y literatura de la UCR.https://revistas.ucr.ac.cr/index.php/filyling

Recursos Didácticos

TítuloDescripciónEnlace
Curso de Bribri IContiene materiales escritos y orales para el aprendizaje del bribri.http://inil.ucr.ac.cr/recursos/materiales-del-curso-bribri/
Latex for LinguistsGuía y recursos para el uso específicamente lingüístico del LaTeX, un lenguaje de marcado y preparación de documentos.https://www1.essex.ac.uk/linguistics/external/clmt/latex4ling/
BabiloniaInformación básica y fácil de entender sobre aspectos básicos de la lingüística. http://lingvo.info/es/babylon
DiaplicoriRecursos sobre las lenguas habladas en Costa Rica.http://www.dipalicori.ucr.ac.cr/
Canal de Youtube del Posgrado en LingüísticaEntrevistas y videos informativos sobre temas en lingüística. https://www.youtube.com/channel/UC-iZdkFz3Q2ah_tpxSPZWLA
Dialectoteca del EspañolLa Dialectoteca del Español es una manera innovadora de experimentar la diversidad de la pronunciación del español. Es una biblioteca audiovisual que usa muestras de habla de una amplia variedad de hablantes nativos para documentar los patrones más representativos de la pronunciación del español moderno. El sitio también incluye descripciones de los factores que causan la variación alofónica, mapas que identifican las principales regiones dialectales, transcripciones ortográficas y fonéticas de las entrevistas, descripciones de los principales rasgos dialectales y ejercicios que les permiten a los usuarios comprobar su habilidad para reconocer dialectos del español con base en sus propiedades fonéticas.http://dialects.its.uiowa.edu/#

Recursos Técnicos

Anotación de Corpus

TítuloDescripciónEnlace
Phonological CorpusToolsHerramienta especializada en el manejo de corpus fonológicos. Tiene dos interfaces: una gráfica y otra de línea de comando.http://phonologicalcorpustools.github.io/CorpusTools/
UAM CorpusToolHerramienta para la anotación de corpus textuales.http://www.corpustool.com/
MMAX2Herramienta flexible de anotación de corpus, especialmente apta para anotar relaciones a nivel de discurso.http://mmax2.net/index.html

Estadística y Manejo de Datos

TítuloDescripciónEnlace
RLenguaje de análisis estadístico y visualización de datos.http://www.r-project.org/
WekaSoftware en Java para clasificación (regresiones, SVM, etc.).https://www.cs.waikato.ac.nz/ml/weka/

Fonética y Fonología

TítuloDescripciónEnlace
Praat Software de análisis fonético.http://www.fon.hum.uva.nl/praat/
Phonological CorpusToolsHerramienta especializada en el manejo de corpus fonológicos. Tiene dos interfaces: una gráfica y otra de línea de comando.http://phonologicalcorpustools.github.io/CorpusTools/
TypeItTeclado para símbolos fonéticos.http://ipa.typeit.org/

Herramientas de Procesamiento de Lenguaje Natural

TítuloDescripciónEnlace
Etiquetador morfológico bribriParser morfológico para la lengua bribri. http://morphology.bribri.net/
NLTK - Natural Language Processing ToolkitLibrería de Python con gran variedad de herramientas de procesamiento de texto, como parsers, tokenizadores, etc. Incluye interfaces a herramientas como Wordnet y diferentes corpora.http://www.nltk.org/
Stanford CoreNLPToolkit con herramientas del state-of-the-art en parsing, resolución de correferencias, PoS-tagging, entre muchas otras.especialmente apta para anotar relaciones a nivel de discurso.https://stanfordnlp.github.io/CoreNLP/
FIPSParser sintáctico del Laboratoire d'Analyse et de
Technologie du Langage de la Universidad de Ginebra.
http://www.latl.unige.ch/
GensimLibrería de python para vectorización (word2vec, etc.) y análisis semántico.https://radimrehurek.com/gensim/
PytorchLibrería de python para deep learning. https://pytorch.org/
PhraseNETSoftware para la extracción automática de unidades fraseológicas.

Visualización de Árboles Sintácticos

TítuloDescripciónEnlace
phpSyntaxTreeVisualizador de árboles sintácticos.http://ironcreek.net/phpsyntaxtree/

Visualización de Corpus

TítuloDescripciónEnlace
Annotation of Information Structure (ANNIS)Visualizador de corpora que puede ser utilizado localmente o alojarse en un servidor. http://corpus-tools.org/annis/documentation.html
NoSketch EngineSoftware libre de manejo de corpus.https://nlp.fi.muni.cz/trac/noske

Logo UCR

| Instituto de Investigaciones Lingüísticas