Saltar al contenido

Base de datos de estructura de carbohidratos

Carbohydrate Structure Database (CSDB) es una base de datos gratuita y una plataforma de servicios en glicoinformática, lanzada en 2005 por un grupo de científicos rusos del Instituto de Química Orgánica ND Zelinsky, Academia de Ciencias de Rusia. CSDB almacena datos estructurales, taxonómicos, bibliográficos y espectroscópicos de RMN publicados sobre Carbohidratos naturales y moléculas relacionadas con los carbohidratos.

Descripción general

Los datos principales almacenados en CSDB son estructuras de carbohidratos de origen bacteriano, fúngico y vegetal. Cada estructura se asigna a un organismo y se le proporciona el (los) enlace (s) a la (s) publicación (es) científica (s) correspondiente (s) en la que se describió. Además de los datos estructurales, CSDB también almacena espectros de RMN, información sobre los métodos utilizados para descifrar una estructura particular y algunos otros datos.

CSDB proporciona acceso a varias herramientas de investigación relacionadas con los carbohidratos:

Simulación de espectros de RMN 1D y 2D de carbohidratos ( GODESS: simulación empírica dual de espectro orientada a glucano ).

Elucidación automatizada de estructuras basadas en RMN ( GRASS: generación, clasificación y asignación de estructuras de sacárido ).

Análisis estadístico de la distribución de características estructurales en glucículos de organismos vivos

Generación de coordenadas atómicas optimizadas para un sacárido arbitrario

Taxón agrupamiento basado en similitudes de glycomes (a base de carbohidratos árbol de la vida )

Subdatabase de glicosiltransferasa ( GT-explorer )

Historia y financiación

Hasta 2015, las bases de datos de la Base de datos de estructura de carbohidratos bacterianos (BCSDB) y la Base de datos de estructura de carbohidratos de plantas y hongos (PFCSDB) existían en paralelo. En 2015, se unieron a la base de datos de estructura de carbohidratos (CSDB). El desarrollo y mantenimiento de CSDB ha sido financiado por el Centro Internacional de Ciencia y Tecnología (2005-2007), el programa de subvenciones del Presidente de la Federación de Rusia (2005-2006), la Fundación Rusa para la Investigación Básica (2005-2007,2012-2014,2015 -2017), y Deutsches Krebsforschungszentrum (a corto plazo en 2006-2010).

Fuentes de datos y cobertura

Las principales fuentes de datos CSDB son:

Publicaciones científicas indexadas en las bases de datos de citas dedicadas, incluidas NCBI Pubmed y Thomson Reuters Web Of Science (aproximadamente 14000 registros).

Base de datos CCSD (Carbbank ) (aprox. 3000 registros).

Los datos se seleccionan y se agregan a CSDB manualmente mediante la exploración de publicaciones científicas originales. Los datos procedentes de otras bases de datos están sujetos a procedimientos de corrección y aprobación de errores. A principios de 2017, la cobertura de bacterias y arqueas es de aprox.

80% de las estructuras de carbohidratos publicadas en la literatura científica en los años 1943 – 2015. El lapso de tiempo entre la publicación de datos relativos y su deposición en CSDB es de aproximadamente 18 meses. Las plantas están cubiertas hasta 1997 y los hongos hasta 2005. CSDB no cubre los datos del dominio animalia, excepto los metazoos unicelulares.

Hay una serie de bases de datos dedicadas en carbohidratos animales, p. ej. UniCarbKB o GLYCOSCIENCES.de.

CSDB se informa como uno de los proyectos más grandes en glicoinformática. Se emplea en estudios estructurales de carbohidratos naturales y en el perfil de gluco. El contenido de CSDB se ha utilizado como fuente de datos en otros proyectos de glicoinformática.

Interrelación con otras bases de datos

CSDB está entrecruzado con otras bases de datos de glucóticos, como MonosaccharideDB, Glycosciences.DE, NCBI Pubmed, NCBI Taxonomy, catálogo NLM, etc. Las estructuras se presentan en múltiples anotaciones de carbohidratos (SNFG, SweetDB, GlycoCT, WURCS, GLYCAM, etc.). CSDB se puede exportar como una fuente de Marco de descripción de recursos (RDF) de acuerdo con la ontología GlycoRDF.