Amid the global biodiversity crisis, there's a growing need to collect, organize, and share biodiversity data worldwide. Historically, local funding has shaped data practices, leading to knowledge gaps in the state of biodiversity. To address this, improving data archiving practices is a cost-effective first step to enhance global microbiome data coverage. Regions with limited resources can reuse data for fresh insights, especially in expensive sequence-based biodiversity research. Data reuse in microbiome research enables researchers to produce high-quality work, including those with limited access to resources or funding. Promoting data reuse can incentivize archiving, increasing the quantity and quality of reusable microbiome data, particularly in countries with limited research funding. As global synthetic microbiome research grows, diverse perspectives foster innovation and understanding of microbiome ecosystems. The Datathon brings researchers in microbial ecology together to archive and reuse local metabarcoding sequences, enhancing discoverability and reusability of regional microbial data. It gives data producers academic credit for their work and creates a valuable resource to foster biodiversity research blind spots. Crucially, the Datathon aims to stimulate synthesis research by participants using the deposited sequences.
The Datathon is organized over the course of three days in a hybrid format, each day with a distinct focus. Day one (Inspire) features a hybrid symposium delving into the history of synthetic research in ecology, the relevance of 'Open Data' in biodiversity research, and the potential and outcomes of recent global biodiversity data syntheses. Day two (Support) focuses on remote, hands-on data deposition in NCBI's Sequence Read Archives, aided by custom online guides in English and Spanish. These guides include a custom metadata sheet with specific fields to allow the rapid integration of all datasets and facilitate post-Datathon data reanalysis. In addition to standard NCBI metadata fields, fields for technical information and the DOI of publications related to the data are included. Additionally, a three-level ontology improves sample environment descriptions. This day, participants can access a dedicated Slack helpdesk channel for personalized assistance, ultimately enhancing the quality of data deposition. Day three (Collaborate) focuses on combining participants' deposited data for its reuse and developing collaborative networks. Participants create Slack channels to brainstorm research ideas and select leaders for synthesis projects. After the event, participants receive detailed summaries of the data resources and projects and can choose to participate.
Debido a la crisis global de biodiversidad, es urgente recopilar, organizar y compartir datos acerca de la biodiversidad a nivel mundial. Mejorar el archivado de datos, recopilando los datos que ya existen, amplía la cobertura global de datos de microbiotas y no requiere de recursos adicionales. El reanálisis de estos datos puede generar nuevos conocimientos, cerrando la brecha geográfica entre productores y usuarios de datos. Promover la reutilización de datos incentiva su archivado, aumentando así la cantidad y calidad de los datos de microbiotas reutilizables, especialmente en países con financiamiento limitado. A medida que la investigación global de microbiotas sintéticas crece, las perspectivas diversas fomentan la innovación y la comprensión de ecosistemas microbianos. El Datatón reúne a investigadores de ecología microbiana para archivar y reutilizar secuencias de metabarcoding regionales. Centraliza metadatos, incluidos bibliográficos, técnicos y experimentales, en una base única para aumentar la visibilidad y reutilización de datos regionales de microbiotas. También reconoce a los autores de datos y promueve la investigación en áreas con poca información sobre biodiversidad, fomentando investigaciones de síntesis a partir de las secuencias depositadas.
El Datatón, realizado en tres días en formato híbrido, aborda objetivos interconectados. El primer día, con el tema "Inspirar", consiste en un simposio híbrido sobre la historia de la síntesis en ecología, la importancia de "Open Data" en biodiversidad y el estado de las investigaciones de síntesis de datos de biodiversidad a nivel global. El segundo día, bajo el tema "Capacitar", se centra en el depósito de secuencias de microbiotas. Para ello, se proporcionan guías paso a paso, en inglés y español, sobre el archivado de datos en el Sequence Read Archives (SRA) del Centro Nacional para la Información Biotecnológica (NCBI). Estas guías utilizan tablas de metadatos personalizadas para integrar las bases de datos de distintos autores. También incluyen datos técnicos, DOIs de publicaciones generadas a partir de los datos y una ontología de tres niveles para describir el ambiente de las muestras detalladamente. Además, los participantes, interesados en compartir datos, cuentan con un centro de asistencia en Slack para evacuar dudas sobre el depósito de secuencias, mejorando así la calidad de los datos depositados. El tercer día, con el tema "Colaborar", se enfoca en aprovechar los datos depositados y crear redes de colaboración para su reutilización. Los participantes crean canales en Slack para desarrollar ideas de investigación y seleccionan líderes a cargo de proyectos de síntesis. Después del evento, los participantes reciben resúmenes detallados de los datos disponibles y las ideas de proyectos, y pueden optar por participar.