Workshop en Humanidades Digitales aplicadas: "Computational Linguistics and Digital Humanities in TEITOK"
Sala Manuel de Terán 3F
Por Marteen Janseen (Institute of Formal and Applied Linguistics, Charles University, Prague)
TEITOK es un framework en línea para trabajar con corpora lingüísticos enfocado especialmente a las Humanidades Digitales. TEITOK permite convertir transcripciones de documentos históricos (manuscritos, inscripciones, monografías, etc.) en corpora textuales buscables. Las transcripciones se almacenan como documentos codificados en el formato TEI y pueden ser automáticamente enriquecidas con anotaciones lingüísticas que pueden ser corregidas manualmente donde sea necesario. Los documentos TEI se pueden mostrar como ediciones digitales interactivas que pueden generar múltiples ediciones a partir de una única fuente XML compleja. Cuando la transcripción está alineada con imágenes facsímiles la transcripción puede mostrarse de distintas maneras junto a las imágenes. TEITOK tiene una configuración modular, por lo que es posible enriquecer documentos con datos de geolocalización, mapearlos, proporcionar named entities, ser analizados en árboles sintácticos, y más opciones que se añaden continuamente al framework. TEITOK es una herramienta de referencia para documentos históricos en español y se utiliza en muchas otras áreas también, contando con una base de usuarios activa.
Este workshop tiene por objeto mostrar el uso práctico de importantes recursos de Humanidades Digitales e Inteligencia Artificial para el tipo de actividades de investigación que se llevan a cabo típicamente en varios institutos del CCHS.
Está abierto a todos los interesados en las Humanidades Digitales de dentro y fuera del CSIC.
Organiza: Daniel Riaño Rufilanchas (ILC-CSIC)