物种数据库搭建 | 百迈客生物

首页
科研服务
- 转录调控
- 微生物组
- 时空组
- 群体遗传
- 基因组
- 蛋白组
- 代谢组
生物云服务
百创智造
技术平台
- Nanopore
- Pacbio
- Illumina
- 10x Genomics
- SLAF
- Waters
- 计算平台
- 自动化平台
合作案例
关于我们
加入我们
- 社会招聘
- 校园招聘
联系我们
EN

首页
科研服务
生物云服务
百创智造
技术平台
- Nanopore
- Pacbio
- Illumina
- 10x Genomics
- SLAF
- Waters
- 计算平台
- 自动化平台
合作案例
关于我们
加入我们
- 社会招聘
- 校园招聘
联系我们
EN

预约方案讲解

量身打造生物数据库，让科研成果快速呈现

百迈客数据库深度融合云计算与生物信息学技术，打造行业领先的数据中枢，支持用户按需自由组合存储管理、智能检索、多维分析等标准化功能模块，无论是本地服务器、私有化部署还是云端集群弹性扩展，均可实现无缝适配。

系统颠覆传统硬盘分散存储+人工检索的低效模式，通过分布式存储架构与语义检索引擎，让千万级基因组数据实现毫秒级调用与跨模态分析，助力科研团队轻松驾驭TB级数据洪流，真正实现从数据采集到知识发现的快速串联，提高大数据背景下用户对大规模基因组学数据管理与分析能力。

团队拥有15年大数据开发挖掘经验的深度积累，骨干人员由深耕行业十余年的资深生信领域专家及软件开发工程师构成，可提供灵活的数据库构建，包括：组学数据库、物种数据库、功能类数据库、育种数据库、云分析数据库、实验室网站平台搭建等多类型数据库搭建。

部分合作案例展示

植物方向
动物方向
微生物方向
医学方向
特色数据库

植物方向

柑橘数据库谷子数据库橡胶数据库

合作单位：西南大学

柑橘是全世界最重要的商业水果作物之一。利用当前可用于柑橘类水果的大量基因组数据，可以开发分子标记和评估种质遗传关系，服务于分子育种和全基因组选择辅助育种。在这项研究中，为方便访问、利用和分享这些数据，该团队开发了一个基于Web的数据库，即柑橘基因组变异数据库（CitGVD），这是第一个针对柑橘且专用于全基因组变异数据和分析的综合数据库，包括单核苷酸多态性（SNP）和插入/缺失（INDEL）。CitGVD的是一种开放获取资源，其资源是从内部项目和公共资源中挑选出来的346个种质的1,493,258,964个高质量基因组变异和84个表型。CitGVD集成了有关基因组变异注释，相关基因注释以及有关种质的详细信息，并集成了多种内置工具来进行数据访问和分析。例如，CitGWAS可用于具有SNP和表型数据的全基因组关联研究（GWAS），而CitEVOL可用于遗传结构分析。本数据库是一个数据与工具的集成分析平台，为柑橘的分子标记挖掘，分子标记辅助育种和分子设计育种提供数据支持。这些功能使CitGVD成为用于柑橘相关研究的综合Web门户和生物信息学平台。它还为构建其他农作物的全基因组变异数据平台提供了范例。

合作单位：山西农业大学

MDSi的模式体系结构可以通过搜索菜单中的基因搜索相应的注释 (Browse → Annotation)、已知基因功能 (Browse → Functional Category) 等方式获得所需研究的基因信息。MDSi 数据库中收录了 33,785 个基因的 161,844 条注释和 4,944 个功能注释。预测的转录因子和转座子也分别分类在浏览菜单中。所有的搜索结果将引导用户到目标基因的基因信息(Gene info)页面，其中包括几个模块，如基因结构(GBrowse, JBrowse)、基因序列、基因表达(更新的xEFP)、蛋白质同源物和基因注释。

合作单位：中国热带农业科学院橡胶研究所

HeveaDB数据库主要储存了橡胶树4个版本的基因组草图、1个遗传图谱、142个转录组数据、49235条EST序列、30200个基因注释、12个基因家族的信息，以及5049个IRRDB 1981’野生种质资源材料和18328个魏克汉材料信息。并以中国热科院橡胶研究所完成的热研7-33-97品种的基因组数据为参考基因组，进行了二次挖掘和分析，进行可视化展示。平台还集成了一系列生物信息学工具，以方便不擅长生物信息学的科研人员使用数据。

动物方向

虾类数据库贝类数据库

合作单位：自然资源部第三海洋研究所

我国是世界上重要的淡水虾产地,淡水虾是一类生活在淡水中的节肢动物，种类非常多，常见的有青虾、河虾、草虾等. Marine shrimp 数据库中收录了不同品种的虾，包含了共290397条基因蛋白序列信息。

合作单位：中国海洋大学

软体动物门是仅次于节肢动物门的第二大动物门，但在基因组学方面仍然研究较少。随着高质量基因组和多样化功能基因组数据的增加，我们有望加深对软体动物生物学和进化的理解。
为了应对软体动物研究社区在管理庞大多组学资源方面的机遇与挑战，该研究开发了MolluscDB 2.0平台，该平台整合了广泛的功能基因组数据，并提供用户友好的多层次整合与比较分析工具。MolluscDB 2.0涵盖了来自软体动物八个纲的1450个物种，并汇编了约4200个数据集，是目前最全面的软体动物多组学资源。MolluscDB 2.0扩展了多组学数据的层次，包括基因组、整体转录组、单细胞转录组、蛋白质组、表观基因组和宏基因组。此外，MolluscDB 2.0将功能模块和分析工具的数量增加了一倍多，更新了14个原有模块，并新增了20个专门的模块。总体而言，MolluscDB 2.0为软体动物研究社区提供了一个高度有价值的开放访问多组学平台，促进了科学发现，深化了我们对软体动物生物学和进化的理解。

微生物方向

线粒体基因组数据库 HelDB微生物数据库海洋微生物数据库

合作单位：四川省农业科学院

微生物线粒体基因组数据库专注于提供微生物线粒体的相关数据与分析资源。其核心内容是整合了705种微生物的线粒体基因组、编码基因、蛋白质序列以及对应的NR注释信息。为了便于用户进行数据挖掘和深度分析，还集成了近10种生物信息学工具，包括用于可视化基因组关系的Circos图绘制、展示数据模式的热图绘制、分子实验所需的引物设计以及识别重复序列的RepeatMasker等，旨在为微生物线粒体的基因组学与比较研究提供一个集中的数据查询与分析平台。

合作单位：河南师范大学

HelDB是一个集成性的综合数据库，收录了涵盖多种植物和动物基因组的Helitron转座子信息。

目前，大量植物和动物的基因组已完成测序，这为挖掘Helitron数据提供了契机。为了给Helitron的比较研究提供一个有用的资源，开发了一套基于HelitronScanner软件的分析流程，系统地从一个包含375种植物和203种动物基因组的庞大集合中，对Helitron进行鉴定、分类和注释。共识别出1,412,736个Helitron元件，覆盖约12.46 Gb的序列。所有这些数据都被编入HelDB数据库。该数据库提供了浏览、搜索和分析模块，用户可通过友好的网络界面和相关软件探索Helitron元件。资源及相关注释均可方便地下载。此外，嵌入了HelitronScanner工具，以帮助用户在线识别其自有基因组序列中的Helitron元件。

合作单位：中国海洋大学

Ocean-M数据库整合了全球多生境、多尺度的海洋微生物多组学数据，汇集了来自全球不同海洋生态系统的57,000余个微生物数据，涵盖宏基因组、宏转录组、宏蛋白质组、宏代谢组等多个层次，样本涵盖了从极地到赤道、从表层到深海的完整生态梯度。通过统一的数据处理和标准化标识符，Ocean-M整合了规模最大的宏基因组（MAGs）数据，包含超过50,000个代表性微生物基因组数据，支持全球范围内微生物群落结构、功能特征及其空间分布的可视化展示。
Ocean-M构建了基于全息组学的生态网络分析框架，整合了微生物群落网络、宿主-微生物组互作及环境DNA数据集，能精确描述查询微生物群落结构、功能特征及其生态位相互关系，实现了生态互作的全维度分析，为生态学研究提供了全新的视角和工具。同时，搭建了“基因组-基因功能-生态偏好”三位一体的系统分析框架，通过大规模的功能基因挖掘，建立了包含百万级功能基因集合，为微生物功能基因的挖掘和生态系统功能解析提供了强有力的支持。

医学方向

肿瘤药物数据库医学数据库质粒数据库

收录整合NCBI,GENE CARD,COSMIC,WHO等数据库中的药物等相关数据信息。能快速检索基因突变与临床肿瘤用药之间的关系及主要功能。

医学数据库收录了miR2Disease、DiseaseMeth、ClinVar等数据库中与人类疾病相关的数据，对于帮助我们提高疾病诊治水平来说具有非常重要的意义。用户可以通过疾病名称进行搜索、浏览，为用户提供医疗测序、分子诊断以及发现基因型和非临床特性之间的关系等研究数据资料。

合作单位：中国疾病预防控制中心传染病预防控制所

质粒数据库（Plasmid Database）基于NCBI收录的天然完整环状质粒构建，通过分析其图谱结构并对质粒进行注释，为用户提供可视化的质粒图谱信息。同时，该数据库提供序列分析功能，能够对用户上传的序列进行质粒类型鉴定、序列结构解析及注释。基于序列相似性分析，上传的序列可与数据库中已知序列进行比对。

特色数据库

互作网络数据库功能基因数据库参考基因组数据库

互作网络数据库专注于收录包括编码基因、非编码RNA等在内的各类生物分子之间的相互作用关系。该数据库提供强大的搜索功能，支持通过Gene ID、Ensemble ID、LncRNA、miRNA等多种方式快速检索到相应的互作网络；并以清晰易读的形式展示目标分子的ID详情与功能注释。同时，它还具备实用的页面筛选功能，用户可基于网络结果便捷地进行数据筛查，并直接下载所需的互作网络数据。

这是一个专为基因功能研究量身打造的基因搜索引擎，它整合了来自约25个数据库的近1,700万条基因信息，旨在提供可靠的基因查询与分析服务。该工具集具备以下核心功能：拥有强大的搜索能力，支持通过基因名、功能或编号等多种方式精准定位目标基因；提供清晰易读的基因报告，便捷地展示基因的详细信息、序列、功能、表达调控及相关研究进展；并配备了实用的收藏功能，用户可保存重要的基因与序列数据，并能直接对接分析平台进行后续数据处理。

参考基因组数据库是一个不断扩展的、专门用于数据分析的标准化的参考基因组数据库。用户可通过多种方式检索数据库，如：物种中文名、拉丁文名、英文名、分类学编号（Taxonomy ID）、参考基因组编号（该数据库的唯一标识符）、版本等。通过计算方法、人工整理、审查相结合的方式，该数据库不断地收录、整理用户提交的私有参考基因组，以及Ensembl Genome、 NCBI RefSeq、 UCSC Genome Browser、 JGI Genome Portal等公共数据库常用的动物、植物和微生物的参考基因组数据，包括参考基因组序列、注释，参考基因、转录本序列、功能注释等。