如何提取一个转录本的3'UTR区域的序列

在做microRNA 和 mRNA 相互作用预测的时候,大家都知道microRNA 作用的靶点是位于mRNA 的3'UTR取,所以只需要提取mRNA 对应的3'UTR 区的序列去做分析即可;

那么如何提取一个mRNA的3'UTR区呢?

在UCSC数据库中,提供了3'UTR区序列的下载,以人类hg19为例, 利用table browser 浏览器选择对应的序列

链接:http://genome.ucsc.edu/cgi-bin/hgTables

按下图所示进行选择

点击get output 按钮,在弹出的页面选择 genomic

点击 submit 按钮,在弹出的页面勾选需要的区域,这里我们只选择 3'UTR区域

然后点击下方的get sequence 按钮,在浏览器中保存文件即可。

UCSC为我们提供了自动化的下载转录本特定区域的功能,如果我们自己来完成这件事,又该如何去做?

其实只需要两步:

1)第一步,确定每个mRNA的3' UTR区在基因组上的位置;

2) 第二步,根据基因组上的位置,从基因组上提取对应的序列就可以了;

如何定义一个转录本的3’UTR区呢,我们看UCSC是如何定义的,

以转录本NM_033487 为例,从UCSC下载的该转录本的序列为

利用NCBI的 nucleotide 数据库检索该转录本序列,链接如下 https://www.ncbi.nlm.nih.gov/nuccore/NM_033487

在对应的页面可以看到 该转录本的ploy A 尾开始的位置为2824;

在对应的序列中,可以看出poly A 尾之前的5bp的序列为aggaa, 和 UCSC对应的3’UTR区是一致的

从UCSC下载的3’UTR序列的长度为523bp,对应的的基因组位置为 chr1:1570603-1571125;

 

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这个任务需要进行基因组注释和序列提取,需要使用到一些生物信息学工具和数据库。以下是一个可能的实现方法: 1. 在 UCSC Genome Browser 上找到人类基因组的注释数据,例如 hg38 版本。 2. 在搜索栏中输入 POLR2A 或 PIGR,找到对应的基因并进入基因页面。 3. 在基因页面中找到 mRNA 的注释信息,下载对应的 mRNA 序列和蛋白序列。也可以使用 UCSC Table Browser 工具下载这些信息。 4. 在基因页面中找到外显子和内含子的注释信息,确定需要提取序列的位置。例如,POLR2A 的第 5 个外显子的起始位置和终止位置可以在页面中找到,PIGR 的第 2 个内含子的起始位置和终止位置可以通过计算得到。 5. 使用 UCSC Table Browser 工具,下载对应基因的基因组序列。在选择数据表时,需要勾选上“sequence”选项。下载的序列文件格式为 FASTA。 6. 使用一个文本编辑器或者命令行工具,将下载的 FASTA 文件和上一步中确定的序列位置进行比对,提取需要的序列。 7. 对于 5UTR 序列提取,可以使用 UCSC Table Browser 工具下载对应基因的 UTR 序列,然后根据 mRNA 序列的起始位置和 UTR 序列的终止位置进行截取。 注意事项: - 在使用 UCSC Genome Browser 和 Table Browser 工具时,需要创建一个账号,并且了解基本的使用方法。 - 序列提取的结果需要进行质控,例如 BLAST 搜索或者多序列比对,确保提取序列与参考序列一致。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值