真核有参转录组

产品介绍

转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有mRNA。转录组测序能够从整体水平研究基因表达量以及基因结构,揭示特定生物学过程中的分子机理;目前已广泛应用于基础研究、临床诊断、药物研发和分子育种等领域。

结果展示

数据质控

为确保Reads有足够高的质量,将下机原始测序数据(raw reads)去掉含有带接头的、低质量的reads,得到clean reads,保证后续分析的准确性。测序因受测序仪本身、测序试剂、样品等因素影响,存在一定的错误率。碱基测序错误率分布图可以反映测序数据的质量。

294
500

参考序列比对

将Clean Reads与参考基因组进行序列比对,获取在参考基因组或基因上的位置信息,定位区域分为Exon(外显子)、Intron(内含子)
和Intergenic(基因间区)。比对到参考基因组上的Reads称为Mapped Reads,Mapped Reads占Clean Reads的百分比,可以评估所选参考基因组组装是否能满足信息分析的需求。

基因表达水平分析

生物学重复的相关性不仅可以检验生物学实验操作的可重复性,还可以评估差异表达基因的可靠性和辅助异常样品的筛查。

609
683

重复相关性评估

生物学重复的相关性不仅可以检验生物学实验操作的可重复性,还可以评估差异表达基因的可靠性和辅助异常样品的筛查。

差异表达基因分析

差异表达基因以火山图、MA图、韦恩图、聚类热图、蛋白互作图等形式呈现,通过火山图(Volcano Plot)可以快速地查看基因在两个(组)样品中表达水平的差异,以及差异的统计学显著性。对于有生物学重复的样本,我们采用DEseq进行样品组间的差异表达分析,获得两个生物学条件之间的差异表达基因集;对于没有生物学重复的样本,使用EBseq进行差异分析。筛选差异基因标准一般为:Fold Change≥2,FDR<0.01。

921
1038

差异表达基因聚类分析

聚类分析用于判断差异基因在不同实验条件下的表达模式,可通过将表达模式相同或相近的基因聚集成类,从而识别未知基因的功能或已知基因的未知功能,同类基因可能具有相似的功能或共同参与同一代谢过程。

差异表达基因GO分类

差异表达基因GO注释分类统计图,直观的反映出在生物过程(biological process)、细胞组分(cellular component)
和分子功能(molecular function),所有基因和差异基因注释GO term的个数分布。可深入挖掘差异基因的功能及所在的信号通路,筛选关注差异基因注释情况。

1219
1333

差异表达基因蛋白互作网络

STRING收录多个物种预测的和实验验证的蛋白质-蛋白质互作的数据库,包括直接的物理互作和间接的功能相关。结合差异表达分析结果和数据库收录的互作关系对,构建差异表达基因互作网络。

常见问题

Q1. 在转录组的三个重复测序中,不是所有基因的的可变剪接都会出现3次,有的出现1次或2次,这种情况如何判定该基因是否存在相应的剪接方式?

答:针对每个样品,同一个基因的不同转录本会存在可变剪接,我们只是根据测序的实际数据对可变剪接进行预测,而不是进行验证;如果要判断是否存在相应的剪接方式,需要实验去验证。重复实验存在一定的差异,会导致可变剪接的不同。

Q2. 转录组结果与基因组比对后,没有相应的注释结果,我们认为是New genes。但是,在NCBI注释后,有些基因的注释结果显示是参考基因组物种,这种基因还能算是new genes吗?

答:我们分析流程中是将测序的Reads比对到参考基因组,然后进行拼接,其中一些reads比对到基因间区并且能拼接出完整的开放阅读框,拼接出来的位于基因间区的这些基因即为新基因。预测得到的新基因才会进行功能注释,所以注释结果与新基因的判断没有关系。

Q3:生物学重复样品中某个样品与其他相关性不太好该怎么处理?会不会影响文章发表?

答:为了确保分析结果的准确性,老师通常会设置3个生物学重复,这样就可能出现生物学重复中某个样品相关性不好的情况,影响后续差异分析结果的准确性。通常可将该处理组中相关性不好的样品剔除,再进行差异分析。后期可通过RT-qPCR等试验手段弥补生物学重复的不足,不会影响文章的发表。