玩转基因组浏览器之使用IGV查看基因结构信息

欢迎关注”生信修炼手册”!

基因结构是最基本的基因组注释信息,通常情况下,我们最关心基因区域内的数据分布情况,有多种文件格式可以存储基因结构信息

  1. GFF

  2. GTF

  3. BED

用固定格式来存储对应的信息,使得生物信息软件可以更加标准化其输入输出,为数据分析带来便利。但是存储在文件中的信息对于我们而言,并不够直观。为了更加直观的查看基因结构,可以使用IGV浏览器,只需要将对应格式的文件导入软件中即可。

基因结构信息的本质是染色体坐标,IGV要求导入的数据必须是排序之后的结果。以GTF文件为例,可以采用如下命令先进行排序

sort -k1,1 -k4,4n -k5,5n hg19.gtf > hg19.sort.gtf

排序之后还需要对文件建立索引,这样检索的速度会更快,用igvtools可以建立索引,命令如下

igvtools  index hg19.sort.gtf

运行完成后,会生成一个后缀为idx的文件,将排序后的gtf文件和其索引放在同一个目录下,然后导入gtf文件即可。导入成功之后,  可以看到如下所示的结果

所有的转录本折叠在同一行进行展示,下方是对应的gene name。这种展示方式称之为Collapsed,  比较节省空间,但是很多的转录本折叠在一起,无法相互区分。

同一个基因的多个转录本会存在重叠,相邻基因的转录本也可能存在重叠,为了更加的区分重叠的转录本,还支持以下两种展示方式

1.  Expanded

结果示意如下

2. Squished

结果示意如下

通过右键可以切换不同的展示方式,Expanded模式下转录本区分的最清楚,但是占据的空间很大,Squished则是一种折中方案,抛弃了gene_name, 进一步压缩了空间。

每一条转录本,由3种元素构成

  1. 矩形

  2. 线条

  3. 箭头

示意如下

其中矩形表示

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
使用.fa和.gff文件创建基因图谱,你可以使用一些生物信息学工具和可视化库。以下是一种常用的方法: 1. 安装基因组浏览器工具:首先,你需要安装一个基因组浏览器工具,例如GBrowse、IGV或UCSC Genome Browser。这些工具可以帮助你加载基因组序列和注释数据,并提供交互式的可视化界面。 2. 准备基因组序列:将.fa文件中的基因组序列导入到基因组浏览器中。通常,这可以通过在界面上选择导入选项并提供.fa文件的路径来完成。基因组浏览器将加载并显示基因组序列。 3. 导入注释数据:将.gff文件中的注释数据导入到基因组浏览器中。这些注释数据包含基因、转录本、外显子等的位置信息。类似于导入基因组序列的方法,你可以通过选择导入选项并提供.gff文件的路径来导入注释数据。 4. 设置可视化参数:根据你的需求和偏好,你可以在基因组浏览器中设置不同的可视化参数。例如,你可以选择显示特定的基因或转录本,调整注释图标的颜色和大小,改变视图的放大倍数等。 5. 浏览和导航:使用基因组浏览器的界面,你可以浏览基因图谱,并进行导航和缩放。你可以通过单击基因或注释对象来获取更多信息查看序列、外显子、启动子等的详细视图。 请注意,具体的步骤和界面可能因所选择的基因组浏览器工具而有所不同。建议查阅相关工具的文档和教程,以了解如何在特定工具中操作和可视化.fa和.gff文件的数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值