R包QuantifyPoly(A)的安装及使用

前言

本文记录了QuantifyPoly(A)1包使用过程中的一些问题


一、文章内容

这个R包出自老牌生信期刊Briefings in Bioinformatics上的文章 QuantifyPoly(A): reshaping alternative polyadenylation landscapes of eukaryotes with weighted density peak clustering,两位通讯作者分别为厦门大学的助理教授叶从庭和福建农林的副教授林俊城(曾在厦大做博后)。作者中还有李庆顺老师,李老师是植物多腺苷化研究的大拿。此前厦大已经在这个领域发表了不少文章,包括很多研究型文章、一些生物信息学方法以及植物APA数据库等,可以说已经形成一套完整的Poly(A) site(PAS)使用的分析流程。但本文依然是对先前方法的一个突破。
很多建库方法都能帮助研究者单碱基精度地识别polyA site的位置,但实际上合并相邻的位点成poly(A) cluster(PAC)、考虑PAC的使用才更合理。虽然我们常说poly(A) Site,但这个概念只在讨论某一次转录事件时有意义。但实际上,即使是对于编码同一蛋白的转录本的转录过程,多腺苷化并不一定精确的发生在某一个碱基上,发生的区间长度可能在几个碱基到十几个碱基之间。对于注释较好的模式物种,这些位点通常就在注释的3’端附近。(从这个角度看UTR似乎是个很精巧设计,一个缓冲区,转录终止即使不那么精确也能翻译出正确的蛋白)
过去合并cluster一般仅仅依靠PAS之间的距离(比如距离在24个碱基以内就合并),因而合并之后PAC大小会分布在一个很广的范围里,比如数据库plantAPAdb中的PAC大小从1个碱基到好几百的都有。很多大的PAC明显是不合理的。在这篇文章中,研究者们就提出了一种新的算法,不仅通过长度,还要考虑每个点上的read count,更准确地去定义cluster。
当然,这篇文章的意义不止于此。还有一些关于动植物PAC附近motif差异的发现,提出了动物中的保守的polyA signal(AAUAAA)在植物中可能不是最重要的信号,并且发现了植物PAC上游富集的UGUA 和 UAAA motif。
接下来让我们一起看看这个包到底如何使用。

名词缩写

  • Poly(A) Cluster – PAC
  • Poly(A) Site – PAS
  • alternative polyadenylation – APA

二、安装

下载链接及相关依赖包可以参考 官方教程
网站针对R版本不同(以R 3.5.0为分界,因为bioconductor的用法不同)给出了两套依赖包安装代码。
实际安装过程中,如果是单独安装一个新的R环境,建议安装3.6以上版本(笔者用了3.6.3)。之前先尝试用3.5.0安装,发现困难重重,可能因为安装时如果不指定包的版本一般会下载并安装最新版,在这个R包的一长串依赖包中,存在着(依赖包的)依赖包依赖更高版本的R(例如DEseq2的一个依赖包 latticeExtra),这时直接按照教程安装就会装不上。3.6以上的R可以避免这类问题。
如果在conda环境中的R里安装,安装不上某些包时,也可以尝试直接用conda装(conda install r-包名),比如proj4就可以这样装:conda install -c conda-forge r-proj4。conda安装时也要注意包的版本,有时装包会有部分依赖被替代成更旧的版本,运行时出现不兼容的情况。
这个包安装的难点在于依赖包多,依赖包都安装完就很容易了。装完包跑一下测试数据。

三、使用

测试数据的运行–以拟南芥的数据为例

参考官方教程 第四节:
4.1 Application of QuantifyPoly(A) in an Arabidopsis dataset

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值