分类: 转录组测序

CircSplice软件可变剪切实现原理

(1) 通过STAR比对至参考基因组序列,得到chimeric reads;

(2) 保留那些比对上同一染色体和链的chimeric reads,通过CIGAR值判断reads的坐标;

(3) 识别BSJ,去除另一端落在供体和受体位点之外的reads,以确保另一端也来自circRNA;

(4) 通过剪切位点GT-AG或者CT-AC对BSJ进行过滤和识别;

(5) 对BSJ进行基因注释;

(6) 将BSJ和其另一端reads比对到基因的外显子或内含子,结合基因注释进行4种剪切类型的判断。允许2bp容错。另外要求代表剪切的read的junction一端坐标与注释外显子的一端坐标一致,以减少假阳性预测;

(7) 通过GT-AG或CT-AC原则对可变剪切事件进行过滤;

(8) 计算可变剪接事件的reads数,并进行标准化(支持可变剪切的reads数*106/总chimeric reads数);

(9) 根据坐标融合不同样本的剪切事件,比较样本间的环状RNA剪切事件;允许2bp容错;

最近文章