真核无参转录组

专业项目方案设计,深度解析数据

根据研究目的、实验材料及经费情况量身定制实验方案和定制化分析方案,

为客户提供从结题报告到文章发表的一站式服务!

  • 实验设计

  • RNA提取

  • 建库测序

  • 数据分析

  • 售后答疑

分析内容

 

-1

百迈客云服务,个性化分析全面升级

 

基于基因功能关键词、基因名称、序列和ID的检索功能、WGCNA分析等深入挖掘基因功能。

选择差异分析方案,差异表达基因集查询、基因集维恩图及共表达趋势分析等。

基因结构挖掘,PCA、系统进化树及SNP分析等。

可视化操作、交互性基因深度挖掘,关键基因功能及通路分析,关注哪里,“点”哪里。

4

百迈客云服务,个性化分析8小时云交付

 

youcan

百迈客云服务,项目进展透明化,尽享极致体验

 

实时追踪项目进展,一切动向尽在掌握。

意见直接反馈项目经理,高效解决。

可对在线项目各维度的服务进行评价。

.jpg

项目经验丰富,硕果累累

公司成立八年以来,转录调控研究共计发表了 130 余篇文章,影响因子累计 400 多分
拥有丰富的项目分析经验,至今累计完成 近300个物种5 万多个样品的转录调控研究
公司拥有 40 余项专利技术和 150 余项软件著作权,可根据项目需要选择最佳分析方案,保障结果精准

深度数据挖掘

50+项目分析人员

丰富的项目分析案例

优化的交互式报告

8年+项目分析经验

专业而热情的售后服务

三个分布式集群服务器

闪电般的分析速度

数据质控

为确保Reads有足够高的质量,将下机原始测序数据(raw reads)去掉含有带接头的、低质量的reads,得到clean reads,保证后续分析的准确性。测序因受测序仪本身、测序试剂、样品等因素影响,存在一定的错误率。碱基测序错误率分布图可以反映测序数据的质量。

-9
-2

测序数据组装

过滤得到的高质量clean reads需通过Trinity软件进行组装得到转录本序列。转录本测序深度除了受测序数据量等影响,还与该转录本的表达丰度有关。为了使各样品中表达丰度较低的转录本组装得更完整,对于同物种的测序样品推荐合并组装可以间接增加测序深度,从而使转录结果更完整,同时也有利于后续的数据分析;而对于不同物种的样品,由于基因组间存在差异,推荐采用分别组装或分开分析。

基因表达水平分析

利用转录组数据检测基因表达具有较高的灵敏度。通过FPKM密度图和箱线图不仅可以反映单个样品基因表达水平分布和离散程度,还可以直观的比较不同样品的整体基因表达水平差异。

-3
-4

重复相关性评估

生物学重复的相关性不仅可以检验生物学实验操作的可重复性,还可以评估差异表达基因的可靠性和辅助异常样品的筛查。

差异表达基因分析

差异表达基因以火山图、MA图、韦恩图、聚类热图、蛋白互作图等形式呈现,通过火山图(Volcano Plot)可以快速地查看基因在两个(组)样品中表达水平的差异,以及差异的统计学显著性。对于有生物学重复的样本,我们采用DEseq进行样品组间的差异表达分析,获得两个生物学条件之间的差异表达基因集;对于没有生物学重复的样本,使用EBseq进行差异分析。筛选差异基因标准一般为:Fold Change≥2,FDR<0.01。

-5
-6

差异表达基因注释及富集分析

差异表达基因GO注释分类统计图,直观的反映出在生物过程(biological process)、细胞组分(cellular component)
和分子功能(molecular function),所有基因和差异基因注释GO term的个数分布。可深入挖掘差异基因的功能及所在的信号通路,筛选关注差异基因注释情况。

差异表达基因蛋白互作网络

STRING收录多个物种预测的和实验验证的蛋白质-蛋白质互作的数据库,包括直接的物理互作和间接的功能相关。结合差异表达分析结果和数据库收录的互作关系对,构建差异表达基因互作网络。

-8
Q1. 如何进行数据挖掘?

答:可从所有基因,差异基因及SNP三个方面进行数据挖掘。所有基因可通过功能注释信息,基因ID,基因名称,序列信息几个方面进行挖掘,同时还可以做表达基因集维恩图,WGCNA等分析。差异基因则可通过维恩图分析不同处理批次几个差异组合共同的差异基因;通常表达量变化趋势一致的基因,可能会有相似的功能,故可通过基因共表达趋势分析来进行差异基因的深入挖掘。SNP则可通过PCA分析,系统进化树,样品间差异SNP筛选及目标区域SNP查询等进行挖掘。以上这些分析均可在我公司云平台免费完成。

Q2. KEGG通路注释文件中,K Number Count 指的是什么?

答: K number Count指相关的酶的数目,比如8(6)代表8个基因注释到这个通路,涉及到这个通路的6个酶,某两个基因(或多个)涉及到同一个酶。

Q3. 测序结果中GO和KEGG富集分析所用的指标分别是KS和Q-value,一般文献用的都是p value<0.05,我想问一下KS和Q-value要分别设置为多少?有没有其他测序的文章用这两个指标。

答:Go富集我们使用的是Blast2GO R包;KEGG是我们根据fisher检验算法自己编写的程序。

KS<0.05,这个值和p-value的意义相同,是TopGO软件包中的一个检验方法。

Q-value<0.01,这个值是对p-value值的一个校正,和FDR概念相似,是fisher检验中的一个检验方法。

测序文章一般不用这两个指标,涉及到算法的文献中才有。

Q4.假设有一个基因A,测序结果中有一部分reads可以比对到3‘和5’端,中间的部分没有序列比对上,那么有什么办法可以延伸序列鉴定到中间部分的序列。

答:(1)用实验的方法: 针对5’端和3’端的序列来设计引物,通过PCR实验进行延长和扩增.
(2)生信办法: 将该基因与它的近源物种做同源,如果能找到同源基因,则将该区域的所有read比对到同源基因上,进而来确定中间部分的序列。