gff文件_linux的日常调整GFF文件中的坐标位置

这篇博客介绍了如何在Linux环境下处理GFF文件,通过调整注释和数据部分的坐标位置。主要内容包括识别和保留注释行,对数据主体部分进行列分割,将特定列的数值相加减1,并删除不必要的列,最终实现GFF文件的坐标位置调整。通过awk命令实现了这些操作。
摘要由CSDN通过智能技术生成

周二洲更在编辑群@我,好玩的题目又来了~

87eb040079f0f6bed10c4f5282b9bc45.png

数据详见:生信练习题:调整GFF文件中的坐标位置——by徐洲更

一直拖到今天周五,正好娱乐一下。

先大概看一下数据吧。数据大概分为2个部分:注释部分和数据主体部分(也就是我们需要处理的部分。)

f8c096dd11d56a21cdf1106b6dbb4eb0.png

因此:

  • 如果是#开头的注释部分,不处理
  • 如果非#开头的部分,则需要将chr8后边的起始位置数值提取出来,实现将该值与后边两个位置列进行相加-1。具体对于第一行而言,就是使得第4列的30280+25234310-1,第5列的30951+25234310-1。并且在数据处理之后,去掉chr8后边这一串:25234310-25266151.

对于需要处理的数据,思路也比较简单,先按照冒号(:)、短横杠(-)和tab分隔符(\t)将数据分列。分列之后,我们需要加上的数值在第2列,需要被加的值则在第6列和第7列。此外,需要排除第2列和第3列进行输出。

我们一步步来看。

首先,我们先将注释文件挑出来不处理,直接打印:

awk '{if(/^#/){print $0}}' target.gff|head
$ awk '{if(/^#/){print $0}}' target.gff|more# This output was generated with AUGUSTUS (version 3.2.3).# AUGUSTUS is a gene prediction tool written by M. Stanke (mario.stanke@uni-greifswald.de),# O. Keller, S. König, L. Gerischer and L. Romoth.# Please cite: Mario Stanke, Mark Diekhans, Robert Baertsch, David Haussler (2008),# Using native and syntenically mapped cDNA alignments to improve de novo gene finding# Bioinformatics 24: 637-644, doi 10.1093/bioinformatics/btn013# No extrinsic information on sequences given.# arabidopsis version. Using default transition matrix.# We have hints for 0 sequences and for 0 of the sequences in the input set.## ----- prediction on sequence number 1 (length = 31842, name = chr8:25234310-25266151) -----## Constraints/Hints:# (none)# Predicted genes for sequence number 1 on both strands# start gene g1# protein sequence = [MERRKVEIKRIEKKSIRQVTFSKRRNGLMEKARQLSILCESSIAVLVVSDSGKLYNSTSGDKAFCSLQISCDLLLVFS# MKRPDACLEEAKSDNVSIDFLKSLEEQLKTALSITRDKKTELMMEFVKTLQEKVSVLVFIYWPFQAMLTLESSKTPSLEITIPS]# end gene g1###

简单解释一下:

  • //:表示匹配<
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值