El objetivo principal de este proyecto consiste en la investigación y desarrollo de T2KNOW, una
plataforma avanzada de análisis de texto basada en tecnologías de Procesamiento de Lenguaje
Natural (PLN), para la extracción y representación de perfiles semánticos de entidades digitales
e identificación de tendencias de investigación a partir del análisis de documentos científico-
técnicos.
Partiendo de este objetivo general, en el proyecto se plantean los siguientes objetivos
específicos:
- Diseñar y desarrollar una arquitectura tecnológica flexible, escalable y robusta para la
gestión y procesamiento de grandes volúmenes de datos no estructurados (texto)
como base necesaria para la realización de análisis avanzados. - Investigar y desarrollar algoritmos avanzados de análisis de texto, con técnicas PLN,
que permitan la extracción de conocimiento y la exploración semántica de contenidos
para la detección de tendencias en la investigación. - Desarrollar tecnologías de visualización de datos para descubrir y representar
gráficamente la evolución de líneas de investigación, temas y tecnologías emergentes
que permitan la identificación de tendencias en la investigación. - Diseñar y ejecutar una prueba piloto para validar las tecnologías desarrolladas en un
ámbito clave como el sanitario, extendiendo su validación hacia otros sectores como el
industrial (plástico) o el TIC, con la confección de corpus específicos de publicaciones
científicas.