分类: 基因组测序

三代测序仪以其超长读长的优势,在基因组组装中备受青睐,目前广泛应用的是PacBio三代单分子荧光测序和Nanopore三代单分子纳米孔测序,因Nanopore测序读长更长且通量高的特点,近几年在基因组组装应用中崭露头角,先后在Nature Biotechnology上发表了人的基因组、Plant cell上发表了野生番茄基因组、Nature Genetics上发表了高粱基因组等等,测序技术已相当成熟。

百迈客自2017年3月开启ONT平台研发立项,2018年8月又引进2台高通量测序仪PromethION。截至目前,百迈客已经构建将近200个物种的文库,组装近百个物种,从测序到分析已经拥有相当丰富的经验。今天小编拿到了新鲜出炉的数据结果,忍不住和大家一起分享~~

ONT测序结果展示

作物类(部分)

林木类(部分)

动物(部分)

水产(部分)

中药材(部分)

注:Species:分析的物种信息;SeqNum:各个长度范围内序列的数目;SumBase:指各个长度范围内序列的总长度;N50Len:reads N50长度;N90Len:readsN90长度;MeanLen:平均reads长度;MaxLen:最长reads长度;MeanQual:质量值。

以上是总结的部分作物类、林木类、动物、水产和中药材的下机数据结果展示,从以上的数据不难看出,平均raeds长度几乎均在20Kb以上,最长reads高达1.6Mb以上(不同样品DNA抽提难易程度不同,会造成一定的影响)。

基因组组装结果展示

上表中最后一列MeanQual就是下机数据的质量值,与碱基准确度的换算公式为:准确度 = 1-10^(-Q/10),经计算  Nanopore下机数据单碱基的平均准确率约为86%左右,这样经过校正的数据再用Canu、SMARTdenovo、WTDBG等软件进行基因组的组装,再经过二代数据的polish之后,碱基的准确度可达到99.99%以上呢!

废话少说,直接上组装结果!

植物(部分)

动物(部分)

注:Species:分析的物种信息;CtgNum:contig数目;CtgLen:contig总长度;CtgN50:contigN50长度;CtgN90:contigN90长度;CtgMax:最长contig长度;GC(%):GC含量占比。
从上表中的组装结果展示,ContigN50平均达到了Mb级别(测序深度对Contig深度也是有一定影响的)Contig N50最长高达26.9Mb。组装连续性还不错,但是基因完整性怎样呢?不妨再看一下评估结果吧~组装评估结果
BUSCO评估结果(部分物种)

注:物种:分析的物种信息;Complete BUSCOs:找到完整基因数;Complete and single-copy BUSCOs:其中单拷贝基因数;Complete and duplicated BUSCOs:多拷贝基因数;Fragmented BUSCOs:预测不完整基因数;Missing BUSCOs:没有预测出来的基因数。

评估结果显示基因完整度均在90%以上!!说明Nanopore数据的组装连续性和完整性都是非常好的,是值得广大科研工作者信赖的哦!

百迈客ONT平台发展历程

百迈客在Nanopore测序方面已经积累了大量的经验,也是中国大陆一家全部通过PromthION/GridION平台及DNA/RNA样本官方认证的公司!若您对Nanopore测序感兴趣,可随时与我们联系,我们将为您提供免费的方案,助力您的科研之行!

 

 

推荐文章