El objetivo principal de este proyecto consiste en la investigación y desarrollo de T2KNOW, una plataforma avanzada de análisis de texto basada en tecnologías de Procesamiento de Lenguaje Natural (PLN), para la extracción y representación de perfiles semánticos de entidades digitales e identificación de tendencias de investigación a partir del análisis de documentos científico-técnicos.
Partiendo de este objetivo general, en el proyecto se plantean los siguientes objetivos específicos:
- Diseñar y desarrollar una arquitectura tecnológica flexible, escalable y robusta para la gestión y procesamiento de grandes volúmenes de datos no estructurados (texto) como base necesaria para la realización de análisis avanzados.
- Investigar y desarrollar algoritmos avanzados de análisis de texto, con técnicas PLN, que permitan la extracción de conocimiento y la exploración semántica de contenidos para la detección de tendencias en la investigación.
- Desarrollar tecnologías de visualización de datos para descubrir y representar gráficamente la evolución de líneas de investigación, temas y tecnologías emergentes que permitan la identificación de tendencias en la investigación.
- Diseñar y ejecutar una prueba piloto para validar las tecnologías desarrolladas en un ámbito clave como el sanitario, extendiendo su validación hacia otros sectores como el industrial (plástico) o el TIC, con la confección de corpus específicos de publicaciones científicas.