El centro tecnológico Eurecat coordina el proyecto europeo Glomicave, que desarrollará una nueva plataforma digital capaz de procesar datos ómicos a gran escala mediante Big Data e Inteligencia Artificial, maximizando el uso de datos preexistentes, con el fin de aumentar la comprensión de los sistemas biológicos en su conjunto.

En concreto, el proyecto, que cuenta con una financiación de 6.372.583 euros, aborda la necesidad de construir sistemas que permitan relacionar genotipos, es decir, el conjunto de contenido genético de un organismo, con fenotipos, que constituyen las características visibles del organismo resultado de la interacción entre su genotipo y el medio ambiente, a través de la integración de datos ómicos experimentales con datos disponibles en repositorios públicos y en textos científicos.

El proyecto “pondrá al alcance de expertos de los ámbitos científico e industrial y de profesionales no expertos una herramienta que les ayudará a identificar y comprender nuevos vínculos entre genotipos y fenotipos animales, vegetales y ambientales”, explica la coordinadora del proyecto Glomicave, Biotza Gutierrez, gestora de programas públicos del centro tecnológico Eurecat.

De acuerdo con Núria Canela, directora de la Unidad de Ciencias Ómicas, una unidad de I+D+i mixta formada por profesionales de Eurecat y de la Universitat Rovira i Virgili (URV), “la integración multi-ómica enriquecida con la extracción e interpretación automatizada del conocimiento contenido en textos científicos permitirá aumentar la comprensión de los sistemas biológicos y realizar asociaciones genotipo-fenotipo más precisas, a la vez que permitirá racionalizar el diseño experimental de nuevos estudios”.

En Glomicave, “la literatura científica, hecha por humanos y para humanos, se transformará en una base de conocimiento computacional, es decir, en un gráfico de conocimiento. Esto permitirá a los usuarios consultar operaciones para encontrar nuevos enlaces genotipo-fenotipo ocultos no descritos explícitamente en la literatura, y también integrar esta información con nuevos datos experimentales en estudios científicos”, añade Núria Canela.

Con este objetivo, se utilizarán estrategias de minería de datos para recopilar y extraer información de la literatura científica, junto con el procesamiento del lenguaje natural (NLP) para interpretar la información e integrarla en la base de conocimiento. Se adaptarán y ampliarán métodos de extracción de información de última generación para texto biomédico para crear y llenar gráficos de conocimiento existentes que representen entidades y conceptos biológicos. Se pondrá el foco en los métodos que proporcionen extracciones interpretables y verificables.

La plataforma impulsada por el proyecto Glomicave se validará en tres sectores industriales diferentes como la ganadería, la agrobiotecnología y el medio ambiente, y se abordarán retos específicos en seis casos de negocio como la tecnología de reproducción animal, la calidad de la carne, el crecimiento y calidad de la fruta, el crecimiento de las plantas, la eliminación y recuperación de fósforo y la producción de bioenergía en el ciclo del agua urbana.

El proyecto Glomicave cuenta con la financiación del programa Horizon 2020 de la Unión Europea y con un consorcio formado por 15 socios de España, Francia, Alemania, Portugal, Bélgica y Dinamarca. Participan cuatro centros tecnológicos y de investigación como Eurecat, coordinador del proyecto, SERIDA, INRAE y Forschungszentrum Julich; tres universidades como Aalborg University, University of Minho y Katholieke Universiteit Leuven; cuatro pequeñas y medianas empresas como ASINCAR, TREE Technology, Allice y AkiNaO; dos grandes empresas como NEC Laboratories Europe y Aguas do Norte; el clúster animal ASEAVA, y UNE como organismo de estandarización.

Una información de EURECAT