BUENOS ESTÁNDARES, MUCHAS CONEXIONES
Cuando viajamos al extranjero podemos tener problemas para cargar nuestro teléfono. Sin el adaptador correcto, no es posible conectar nuestros dispositivos y nos quedaremos rápidamente sin batería. Con un adaptador universal, cualquiera puede viajar a cualquier parte del mundo. Lo mismo ocurre con los metadatos: no importa el tipo de datos ni el lugar donde estén almacenados, las normas sobre metadatos permiten a cualquiera encontrar, acceder y utilizar los datos para sus estudios de investigación.
¿QUÉ SON LOS METADATOS? ¿POR QUÉ ES IMPORTANTE DISPONER DE ESTÁNDARES?
Los metadatos son "datos sobre datos". Sin embargo, no todos los metadatos son útiles, y los estándares deben ser acordados por la comunidad investigadora e, idealmente, seguir una serie de directrices denominadas principios FAIR. Los estándares de metadatos ayudan a crear catálogos de metadatos para que los datos sean localizables y accesibles, y pueden servir también como adaptadores para que los datos sean interoperables y reutilizables.
Para poner un ejemplo sencillo, cuando buscas una película en una plataforma de streaming, encuentras información como el año de estreno, el género de la película, el director, la duración. La información describe la película y facilita la búsqueda de la que te interesa y la decisión de verla o no.
Lo mismo ocurre con los datos de investigación: si la información sobre los datos es precisa y detallada, será mucho más fácil para un investigador descubrir que los datos existen y utilizarlos para su análisis. Si un investigador encuentra dos conjuntos de datos potencialmente útiles, pero uno se refiere a las localidades por su nombre y otro por los códigos postales, es necesario un estándar de metadatos para combinar los datos.
Todos utilizamos estándares de metadatos a diario: cuando utilizamos nuestro GPS para ir a la Torre Eiffel, deberíamos acabar en el mismo sitio, independientemente de la aplicación que utilicemos. Unos buenos estándares de metadatos permiten a los desarrolladores de aplicaciones dirigir a las personas a donde quieren ir, independientemente de que hayan introducido "Torre Eiffel", "Tour Eiffel" o "75007".
LOS DATOS DEBEN IR ACOMPAÑADOS DE METADATOS DESDE LA FASE DE DISEÑO
El mejor libro de la biblioteca no se encontrará si no está indexado de forma estándar. Los distintos elementos de la biblioteca tienen diferentes formas de ser encontrados. Por ejemplo, una revista tiene un número, un libro puede ser una edición especial, un cómic puede formar parte de una serie más amplia. Lo mismo ocurre con los datos: los datos sociales, médicos y biológicos requieren metadatos diferentes para describirlos adecuadamente.
Los estándares de metadatos son necesarios para encontrar, vincular y utilizar estos datos para la investigación en distintos campos. Las normas para datos y sus metadatos contextuales y experimentales asociados también se conocen como normas de datos, normas de metadatos o normas de contenido, y pueden clasificarse en cuatro subtipos de normas: directrices o listas de comprobación de informes, modelos/formatos o sintaxis, artefactos terminológicos y esquemas de identificadores.
Es esencial que la captura y estandarización de metadatos se incorpore a los planes al principio de cualquier proyecto de investigación, antes de que se recojan los datos. Así se garantiza que los datos encuentren su lugar correcto en un ecosistema global de información. Unos buenos metadatos también mejoran la calidad y fiabilidad de los datos y la confianza en los resultados de la investigación.
BUENOS ESTÁNDARES, MUCHAS CONEXIONES
En el proyecto BY-COVID hay muchas fuentes de datos (por ejemplo, bases de datos, repositorios y bases de conocimiento) de diferentes disciplinas de investigación, incluidas las biociencias, la investigación clínica y epidemiológica, y las ciencias sociales y humanas. Estas fuentes de datos se describen en una [colección FAIRsharing(https://fairsharing.org/3773) (en curso), junto con los estándares de datos y metadatos utilizados por cada fuente de datos. Se ha desarrollado un modelo común de metadatos para representar los metadatos de cada fuente y hacerlos localizables en un solo lugar: el Portal de Datos Covid-19.
Desarrollar un modelo común de metadatos es un reto importante, ya que en el proyecto participa un gran número de investigadores de distintos campos científicos, y cada fuente de datos de los socios utiliza normas de metadatos diferentes. El planteamiento consiste en mapear las interrelaciones clave entre los metadatos de una forma que tenga sentido y sea práctica de aplicar. De este modo se abren interesantes posibilidades para descubrir más sobre cómo afectan las enfermedades infecciosas a las personas y para fundamentar la elaboración de políticas basadas en pruebas.
SI QUIERE SABER MÁS...
FAIRsharing Educational: infórmese sobre normas para datos y metadatos, cómo le ayuda el registro FAIRsharing si es consumidor o productor de datos, normas para metadatos, bases de datos y políticas de datos.
Más información sobre metadatos: Introducción a la gestión de metadatos
Descubra cómo se utiliza la indexación para enlazar datos en el proyecto BY-COVID: Lanzamiento del sistema de indexación para vincular datos COVID-19 entre disciplinas de investigación
Más información sobre la importancia de contar con normas de metadatos (en general) : 5 Minute Metadata - What is a standard?
Más información sobre la importancia de las normas de metadatos frente a la pandemia COVID-19: COVID-19 pandemic reveals the peril of ignoring metadata standards | Scientific Data
Encuentre herramientas y directrices que le ayudarán a acceder, analizar y compartir datos sobre enfermedades infecciosas, y a responder rápidamente a los brotes de enfermedades: Infectious Diseases Toolkit
BY-COVID D2.1: Armonización inicial de datos y metadatos a nivel de dominio para permitir respuestas rápidas a COVID-19 https://doi.org/10.5281/zenodo.7017728
Obtenga más información sobre las recetas que le ayudarán a hacer que los datos sean FAIR en el FAIR Cookbook, un recurso en línea de recetas prácticas para "FAIR doers" en las Ciencias de la Vida. The FAIR Cookbook - pre-print: “The essential resource for and by FAIR doers”, FAIR, ethical, and coordinated data sharing for COVID-19 response: a review of COVID-19 data sharing platforms and registries | Zenodo
Packaging research artefacts with RO-Crate - IOS Press
Lightweight Distributed Provenance Model for Complex Real–world Environments | Scientific Data