原文:NAD tagSeq for transcriptome-wide identification and characterization of NAD+-capped RNAs
发表杂志:Nature Protocols
影响因子:10.4
原文链接:https://sci-hub.ren/10.1038/s41596-020-0363-z

导读

研究发现几种NCIN(noncanonical initial nucleotides)可以给RNA“加帽”,并可能调节RNA的稳定性,转录和翻译。NAD +是最近发现的NCIN之一,能够给很多物种“加帽”。鉴定NAD+capped RNA(NAD-RNA)可能有助于揭示cap介导的调控机制。本文报道了一种称为NAD tagSeq的方法,用于NAD-RNA的全基因组分析。真核mRNA的5’末端一般都包含一个甲基化的帽子(m7G),在转录起始形成。帽子不仅保护5’-3’核酸酶对mRNA的降解,而且可以形成一个cap-binding复合体,介导转录和翻译过程。最近研究发现RNA能被一系列非典型核苷酸衍生物加帽,比如NAD+,FAD,dpCoA,表明存在另一种帽子介导的基因调控。这些调控可能包括改变RNA的稳定性,转录起始以及与参与mRNA转运的蛋白质相互作用。NAD +是细胞氧化还原反应中的核心辅酶,可能调节NAD-RNA的水平。但是,NAD-RNA的鉴定以及NAD +cap介导的生物学功能在很大程度上是未知的。

1. NAD captureSeq
几年前,开发了NAD captureSeq,用于NAD-RNA的转录组范围分析。在NAD captureSeq中,腺苷二磷酸核糖基环化酶(ADPRC)用于将NAD +的烟酰胺部分替换为含炔烃的分子,称为4-戊炔-1-醇。然后通过点击化学反应(铜催化的叠氮炔炔环加成(CuAAC))将炔基化产物与生物素叠氮化物连接。用链霉亲和素树脂富集生物素标记的RNA,然后制备通过二代测序技术(NGS)测序的cDNA文库。阴性对照RNA样品的处理方法相同,但不使用ADPRC。如果与阴性对照相比,在ADPRC处理的样品中富集了特定的RNA,则其某些转录本被认为是NAD + capped。通过NAD captureSeq,已在细菌,酵母,植物和人类细胞中鉴定出NAD-RNA。缺点:非生物素化的RNA与链霉亲和素树脂的非特异性结合。由于NAD-RNA水平很低,因此非特异性结合可能会显著降低敏感性并引入误差。在生物素标记过程中RNA的断裂以及随后cDNA文库的构建导致NAD-RNA总体序列结构信息的丢失。

2. CapZyme-Seq
CapZyme-Seq用于鉴定含有NAD+ cap或其他非经典caps的RNA。在这种方法中,RNA decapping酶(例如来自大肠杆菌的NudC)用于水解NCIN cap以形成5′-单磷酸RNA。然后将decapped的RNA与RNA寡核苷酸连接,而无法将m7G capped RNA与寡核苷酸连接。然后将与RNA寡核苷酸连接的RNA反转录为cDNA,以通过高通量测序来扩增和鉴定NCIN-capped RNA。缺点:在CapZyme-Seq中,NudC不仅会水解NAD + cap,而且还会裂解其他非经典caps,因此很难区分是否NAD-RNAs。

3. NAD tagSeq
与NAD captureSeq一样,NAD tagSeq方法也使用ADPRC催化的反应和CuAAC反应来标记NAD-RNA。但是,NAD tagSeq不使用生物素标记NAD-RNA,而是在点击化学反应中使用与合成RNA tag缀合的叠氮化物,从而使NAD-RNA与RNA tag连接(图1)。然后,通过利用ONT平台直接对RNA进行测序。RNA tag可作为NAD-RNA的标识符,这意味着假定在其5’端包含tag序列的RNA read被NAD+ capped。RNA tag还可以用于通过与具有互补序列的DNA寡核苷酸杂交,来富集标记的RNA,富集步骤是可选的。通过富集,可以增加NAD-RNA的测序覆盖率。如果不进行富集,则通过纳米孔测序来识别标记和非标记转录物,从而获得NAD-RNA与总转录组的比率。NAD tagSeq方法还可以对来自相同基因的NAD-RNA和总转录本的相对丰度进行定量。标记步骤之后,通过使用聚腺苷酸化酶将poly(A)尾巴添加到所有RNA中,因为只有含poly(A)的RNA可以通过牛津纳米孔测序进行测序(图1)。结果,NAD-RNA在5’端被RNA tag标记,在3’端被聚腺苷酸化,而其他RNA仅进行聚腺苷酸化。然后,对所有RNA与RTA连接,逆转录和连接RNA测序接头。最后,通过Nanopore直接进行RNA测序。

Guppy给出的reads后,需要鉴定NAD-RNA。碱基识别无法识别1,2,3-triazole附近的序列;因此,使用来自每个基因的tag和untagged的RNA分别代表NAD-RNA和noncapped RNA。由于tag RNA的长度为40个核苷酸,并且连接会影响碱基识别,因此对前40个核苷酸中具有12个连续tag RNA核苷酸的reads,将它们归类为tag RNA。然后将reads与参考基因组和转录组比对,以找出只存在于ADPRC+样品中的基因。标记的NAD-RNA的结构可通过Integrative Genomics Viewer可视化。

图1 NAD tagSeq的流程

4. NAD tagSeq实验设计
(1)使用model NAD-RNA验证标记过程
为了分析RNA tag的标记效率,作者使用T7 RNA聚合酶通过体外转录合成了NAD-RNA模型(38个核苷酸)。NAD-RNA模型的转录是由T7 II类启动子驱动,并且只有第一个转录的核苷酸是腺苷,因此NAD +可以在5’末端的转录本中掺入。然后合成NAD-RNA使用PAGE凝胶纯化。使用PAGE凝胶进一步监测model NAD-RNA的纯度(图2)。然后,model NAD-RNA与4-pentyn-1-ol进行ADPRC催化的化学酶反应,与tagRNA-叠氮化物(25个核苷酸)进行CuAAC反应。通过PAGE凝胶检测产物,其中将缺乏ADPRC(ADPRC-)的反应用作阴性对照。

 图2 纯化的model NAD-RNA的凝胶电泳

 
(2)用于NAD tagSeq的RNA样品制备
RNA的片段化和降解会降低使用NAD tagSeq识别NAD-RNA的效率。对于RNA样品制备,建议使用新鲜的组织提取RNA。或者,可以在获得后立即在液氮中冷冻组织。建议在tag实验中使用100μg RNA。
 
(3)用RNA tag标记NAD-RNA
为了进行反应,首先在ADPRC催化下,用接头修饰model NAD-RNA或总细胞RNA。然后,与炔烃相连的RNA与特定的tagRNA-叠氮化物(40个核苷酸)进行点击化学反应。阴性对照,除了不添加ADPRC以外,以相同方式处理样品。阴性对照的结果有助于评估RNA分子非特异性标记产生的噪音。
 
(4)总RNA的聚腺苷酸化
纳米孔直接RNA测序需要RNA包含poly(A)尾巴。如果将真核mRNA用作输入样品,则不需要聚腺苷酸化步骤。但是,如果研究的重点是其他类型的无聚腺苷酸尾巴的RNA,则需要进行聚腺苷酸化。该步骤由poly(A)聚合酶催化,向每个RNA添加poly(A)尾,然后使用oligo dT磁珠纯化RNA。
 
(5)富集NAD-RNA用于深度测序
此步骤是可选的,可进行此操作以增加NAD-RNA的测序覆盖度。标记的NAD-RNA被固定在磁珠上的DNA寡核苷酸富集,并具有与RNA tag互补的序列。
 
(6)文库制备和利用MinION进行测序
通常,使用200–500 ng的RNA制备测序文库。按照ONT公司的直接RNA测序方案,将RNA样品与RTA连接,逆转录并与测序接头连接,所有这些都可以通过纳米孔直接RNA测序试剂盒完成。然后,可以在Nanopore测序设备上对生成的文库进行测序。使用MinKNOW软件和Guppy数据处理工具包进行碱基识别。
 
(7)从测序reads中鉴定NAD-RNA
尽管碱基识别软件无法识别1,2,3-三唑键附近的序列,但Guppy给出的reads仍可通过tag RNA来确定NAD-RNA。在NAD tagSeq的原始应用程序中,作者开发了Python脚本,并结合了诸如Guppy和Minimap2(ref.)之类的可用工具来实现数据分析。为了提高该方法的性能,建立了称为TagSeqTools的计算流程。在这里,介绍了一组用于识别和定量NAD-RNA的详细过程,该过程使用TagSeqTools和现有软件(例如FastQC)。使用TagSeqTools中的TagSeek模块区分NAD-RNA和非NAD RNA。
从TagSeek步骤生成的带标签和不带标签的reads可以接受TagSeqQuant,它使用Minimap2的默认比对参数。在TagSeqQuant中,还通过FastQC对reads进行质量检查,并生成一个html文件以显示测序质量。经过上述分析步骤后,将生成NAD-RNA和非NAD-RNA的基因覆盖文件,以进行IGV可视化(图3),并生成基因和isoforms的计数表以进行进一步分析。

图3 NAD-RNA和noncapped-RNA reads可视化图

5. NAD tagSeq的优缺点
优势:首先,NAD tagSeq可以使用5’端的RNA tag作为有效的工具,以过滤掉一些假阳性。在NAD captureSeq中,将非特异性结合链霉亲和素树脂的RNA分子与生物素标记的RNA一起转换为cDNA文库。非特异性结合问题也发生在NAD tagSeq中。但是,NAD tagSeq可以使用直接RNA测序通过RNA tag的存在来区分NAD-RNA与其他非特异性结合的NAD-RNA。其次,NAD tagSeq不需要像NAD captureSeq一样的PCR程序,通过避免PCR引起的偏倚,可以使NAD-RNA的定量更加准确。NAD tagSeq还允许定量总转录本中NAD-RNA的绝对丰度和相对丰度。

第三,NAD tagSeq比NAD captureSeq更简单,因为可以在标记后直接识别RNA,因此省去了制作cDNA文库的整个过程。

第四,NAD tagSeq可以揭示NAD-RNA的整体序列。ONT测序技术允许将RNA分子从3’端到5’端测序。因此,可以揭示RNA分子的序列。它允许分析cap如何通过转录后修饰(如选择性剪接或5’非翻译区)调节RNA功能。

第五,将来可能会应用通过合成RNA tag标记NAD-RNA然后进行直接RNA测序的想法,以开发类似的方法来鉴定其他NICN-capped RNA,可以开发特定的酶和/或点击化学反应来标记其他NCIN capped RNA。

局限性:纳米孔测序从3’端到5’端,有时会导致reads被截断,这意味着RNA的5’区域可能未测序。因此,某些没有RNA tag的reads可能来自NAD-RNA,这会引入一些假阴性。

此外,如果在标记之前不进行聚腺苷酸化步骤,RNA的断裂(例如在铜离子存在下的点击化学反应期间)可能会导致假阴性。

NAD tagSeq的另一个缺点是,由于ONT芯片的成本很高,它比NAD captureSeq更为昂贵。此外,Oxford Nanopore测序平台在对小RNA进行测序方面存在局限性。获得的最短测序reads(不包括poly(A)尾部和RNA标签序列)约为80个核苷酸,这增加了一些小NAD-RNA可能被该分析遗漏的可能性。推测Illumina测序也可用于NAD tagSeq。但是,还需要进一步测试逆转录酶是否可以通过RNA tag和NAD cap之间的joint以到达RNA tag区域。

总结

NAD tagSeq结合ONT direct RNA检测方案可用于全基因组范围内的鉴定和定量,包括真核生物和原核生物在内的不同生物体中的NAD RNA。它可用于比较不同样品中的NAD-RNA图谱,并分析细胞NAD-RNA的总体水平和单个NAD-RNA的水平。如果跳过tag RNA的富集,则该方法可产生同一基因中NAD-RNA的丰度和总转录本的信息。此外,NAD-RNA的整个序列结构可以通过长读测序技术揭示出来。该技术可用于分析不同生理条件下的NAD-RNA,并将其与总转录组和蛋白质组进行比较,以揭示NAD RNA在介导基因表达中的可能作用。
最近文章