分类: 时空组学

随着单细胞技术的普及与应用,实验流程中的质控标准、Cell Ranger和Seurat等软件的分析内容,已不再是单细胞小白的困扰,目前单细胞测序的难点在于获取测序数据后,基于标准分析结果如何进行后续的数据挖掘,进一步解释生物学现象。

单细胞测序数据挖掘方向

数据处理​ 细胞分群注释​ 差异分析​ 功能分析​ 细胞通讯分析​
  • 细胞过滤
  • 基因过滤
  • 多样本整合分析
  • 细胞周期评估
  • 细胞再聚类
  • 自动化注释
  • 人工注释校正​
  • 组间细胞类型的比例变化
  • 组间同细胞类型的差异基因​
  • GO/KEGG
  • Reactome
  • GSEA
  • GSVA
  • AUCell​
  • NicheNet
  • CellChat
  • CellphoneDB
  • NATMI​
发育轨迹分析​ 转录调控分析​ 肿瘤异质性分析​ 临床相关性分析​ 单细胞联合空间​
  • 拟时序分析
  • 拟时开关基因鉴定
  • 分支调控基因分析
  • RNA速度分析​
  • SCENIC
  • pySCENIC
  • hdWGCNA​
  • InferCNV
  • CNVscore
  • ITH_score
  • 肿瘤免疫浸润​
  • TCGA
  • GEO​
  • Seurat
  • SPOTlight
  • AddModuleScore
  • spatialDWLS​

单细胞测序数据个性化分析方法

单细胞测序数据的挖掘方向复杂多样,针对不同领域的生物学表型和机理研究,需要持续不断地开发个性化分析内容,从不同的角度进行个性化数据挖掘,以下就是单细胞测序数据个性化分析的几个分析方向:

1、单细胞测序个性化分析方法:细胞轨迹分析–揭示细胞发育分化动态轨迹

细胞轨迹分析可以在单细胞分辨率验证已知的细胞分化关系,推断未知的细胞分化路径,挖掘一些稀少的中间状态细胞,解析细胞分化过程中的起调控作用的关键基因,在发育生物学中细胞分化、谱系发育研究方向、肿瘤/疾病微环境中免疫细胞的动态变化研究中均有广泛应用。目前进行细胞轨迹分析的方法和软件非常之多,大致可以概括为两种方法,一种是以monocle软件为代表的拟时序分析(pseudotime analysis),另一种则是以velocyto /scVelo为主的RNA速度分析(RNA velocity)。详情>>单细胞数据分析没有思路?试试细胞轨迹分析~(内附代码)

2、单细胞测序个性化分析方法:细胞通讯分析–解析细胞间的信号通讯关系

多细胞生物是由很多不同类型细胞组成的开放而复杂体系,配体受体复合物介导的细胞间通讯对协调发育、分化和炎症等多种生物学过程至关重要。细胞通讯分析,又称细胞受体-配体互作分析,是以细胞亚群的基因表达量数据为研究对象,通过获得细胞中配体及受体基因的表达信息,比较细胞类型之间的配体与受体基因表达差异,分析得到细胞亚群间的信号通讯关系,在阐明生物学过程中细胞间通讯的复杂性、多样性和动态性方面有重要意义。

3、单细胞测序个性化分析方法:GSEA/GSVA分析–基于功能基因集的富集分析策略

GSEA( Gene Set Enrichment Analysis),是2005年由Broad Institute研究开发的一种基于基因集的富集分析方法,用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。GSEA是从所有基因的表达丰度出发,分析在不同的通路中的基因的整体表达影响,这也是区别于GO/KEGG富集分析的地方,GSEA不需要设定差异阈值筛选目标基因集,理论上更容易囊括细微但协调性的变化对生物通路的影响。Broad研究所在GSEA发布8年之后,开发了GSVA(Gene Set Variation Analysis)算法来拓展基因集分析的应用。GSEA分析主要用于两两组间比较的方案设计中,对于分组比较复杂的方案设计则比较适合GSVA分析,GSVA不需要预先进行样本之间的差异分析,依据表达矩阵就可以计算每个样本中特定基因集的变异分数。

4、单细胞测序个性化分析方法:肿瘤拷贝数变异分析–揭示恶性细胞表型

拷贝数变异(Copy number variation, CNV)是由基因组发生重排而导致的,基因组大片段的拷贝数增加或者减少,基因组结构变异(Structural variation, SV) 的重要组成部分,也是人类疾病的重要致病因素之一。与正常细胞相比,肿瘤基因组部分区域呈现过表达或低表达状态,通过与一组参考的“正常”细胞相比,比较不同样本间或不同细胞类型之间的CNV基因表达差异,探索肿瘤基因组位置上基因的表达强度,最终反映基因大片段区域的CNV事件,鉴定体细胞整个染色体或大片段染色体的扩增或缺失。

5、单细胞测序个性化分析方法:转录因子活性分析–挖掘关键调控转录因子

单细胞研究通常会涉及到一个核心关键问题:细胞的异质性以及这种异质性是如何发展和维持的。这种细胞异质性很大程度上是由潜在的基因调控网络决定的,特定转录因子(transcription factor,TF)集合的协同表达驱动各自靶标基因的表达,从而建立特定的基因表达谱。因此,单细胞的基因调控网络对于深入挖掘细胞异质性背后的生物学意义是至关重要的。利用pySCENIC从单细胞转录组数据中推断TF、基因调控网络和细胞类型,基本原理是基于共表达和DNA调控保守序列(motif)分析推断基因调控网络,然后在每个细胞中分析网络活性以鉴定细胞状态。

6:、单细胞测序个性化分析方法:加权基因共表达网络分析–筛选表型相关核心调控网络

加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis, WGCNA)是构建基因共表达网络的常用方法,可以探索模块与特定表型或疾病的关联关系,最终达到鉴定基因网络的目的;单细胞测序技术可以揭示特定肿瘤组织中的细胞特异性,对细胞进行分类,并且识别特定的标志物,但其检测的细胞数量和病例来源都是有限的。利用WGCNA分析单细胞转录组测序数据,可以提供一套有别于高変基因、差异分析的方法,不依赖于数据库直接用表达量的相关性值预测调控关系,筛选某些细胞亚群中有关联作用的基因集(称为模块),可以从成千上万的基因中挑选出高度相关的基因的模块,并将模块与表型进行关联,寻找marker gene或治疗靶点。

7、单细胞测序个性化分析方法:单细胞空间联合分析-解析空间结构异质性

基因表达具有时间和空间特异性,单细胞转录组主要从时间上研究基因表达,能够系统的识别组织中的细胞亚群,但没有捕获其空间组织信息,限制了我们对组织及细胞间相互作用的理解。而空间转录组的应用使得人们能够从空间的角度解析数据,在空间上研究基因的表达。通过整合两种数据模式,将单细胞转录组数据和空间转录组数据进行联合分析,在时空上分析基因的表达具有重要的意义。

 

如果您对以上个性化分析方案感兴趣,欢迎点击下方按钮联系我们,我们将免费为您设计文章思路文章。

推荐文章