分类: 医学研究
在表观多组学联合分析中,需要对某个区域进行可视化。igv、UCSC、GBrowse、WashU Epigenome Browser、R包Sushi等都可对多组学数据进行可视化。
今天给大家介绍一款基于python语言的软件pyGenomeTracks, 拥有和基因组浏览器相同的展现形式。它能够满足Hi-C、ChIP-seq/ATAC-seq、RNA-seq和BS-seq等多种组学数据类型,是一款功能强大且使用方法简单的强大软件。
 pyGenomeTracks首先生成绘图文件,bigwig、bed、Hi-C文件,然后根据绘图文件生成配置文件name.ini; 最后使用pyGenomeTracks命令对特定区域生成相应的结果文件。具体的使用方法如下:

1、 安装软件

pyGenomeTracks使用conda、pip和源码安装,推荐使用conda安装

参考网址:https://pygenometracks.readthedocs.io/en/latest/content/installation.html

2、 绘图文件

pyGenomeTracks旨在产生高度可定制的高质量基因组浏览器轨道。目前,可以绘制:

 

具体格式说明,见

https://www.jianshu.com/p/4880f1969919

epilogos文件:将表观遗传状态(例如来自chromHMM)可视化。有关更多信息见:https://epilogos.altiusinstitute.org/;使用qcat文件绘制epilogos。文件可以使用epilogos软件创建;软件链接:https://github.com/Altius/epilogos
narrow peaks文件: MACS2 narrowPeak格式;其中根据峰的起点,终点,峰顶和高度绘制了峰的形状。
Hi-C矩阵文件: 矩阵必须用h5格式,如果我们利用HiCPro软件得到的矩阵需要使用HiCExplorer的hicConvertFormat转成h5格式。它可以对h5、cool、hic、homer、hicpro这些格式相互转换。eg:
参数说明:
具体参数说明见:

https://hicexplorer.readthedocs.io/en/latest/content/tools/hicConvertFormat.html?highlight=hicConvertFormat%20

 

3、 使用过程

第一步:准备绘图配置文件:可自动生成,也可以按照模板手动填写

参数说明:

单个track

生成绘图配置文件tracks.ini如下:

 

第二步:绘图代码

 

参数说明:

 

生成的结果如下:

 

多个track

 

结果如下:

pyGenomeTracks还可以绘制更复杂的图形哦!

 

 

多组学分析的时候经常会对相同的文件绘制不同的区域,pyGenomeTracks可生产一个region.bed文件,进而对相同的文件绘制不同的区域:

 

 

更多示例见:https://pygenometracks.readthedocs.io/en/latest/content/examples.html

 

参考文献:
Ramírez, F., Bhardwaj, V., Arrigoni, L. et al. High-resolution TADs reveal DNA sequences underlying genome organization in flies. Nat Commun 9, 189 (2018). https://doi.org/10.1038/s41467-017-02525-w
最近文章