生物信息之独孤九剑——cut

今年到目前写了不少内容,本来想写专题的,而且已经写了两个了,一共写了40篇。结果突然有一天发现,两年前写的一个专题还没有写完。本来要写一个生物信息之独孤九剑,结果只写了七篇,后来居然忘了继续更新,变成了《七种武器》。现在要继续更新完。令狐冲被费了内力,但却是《笑傲江湖》中的高手,原因在于他学会了独孤九剑,能够见招拆招。遇到任何问题都能有方法应对。我们给大家推荐的Linux九个重要命令,熟练之后,也可以处理生物信息分析中大量问题。
1、cut介绍:

cut顾名思义用来切割数据,就是将一段数据进行分割,然后取出我们想要的部分。可以简单的认为split命令是按照行来进行切分数据的,而cut则是按列来切分数据的。前面介绍过通过sed可以输出文件中任意的行,而通过cut可以输出任意的列。
2、cut选项参数:

-b :以字节为单位进行分割。
-c :以字符为单位进行分割。
-d :自定义分隔符,默认为制表符。
-f :与-d一起使用,指定显示哪个区域。
-n :取消分割多字节字符。仅和 -b 标志一起使用。

3、cut用法:

cut命令主要是接受三个定位方法:

第一,字节(bytes),用选项-b;

第二,字符(characters),用选项-c;

第三,域(fields),用选项-f。

4、案例一:通过字节进行分割;

比如这里有个一个blast比对m8格式的列表文件,生物数据分析中有很多列表格式的结果。
我们使用cut -b 1 然后blastm8.list。就是将文件中每一行第一个字符输出出来。输出结果就是一堆字符gggggg。

在这里插入图片描述

5、案例二:一次取出多个字节;

cut支持多个字符,比如1-28,则将第一列提取出来了。

在这里插入图片描述

在这里插入图片描述

6、案例三:自定义字符进行分割;

-c是按照字符进行提取,和-b有些类似,这两个使用起来都不方便,因为刚才提到的-b和-c只能在固定格式的文档中提取信息,而对于非固定格式的信息则束手无策。这时候“域”就派上用场了。域其实就是先设置“间隔符”,再设置“提取第几个域”。
比如还是刚才的例子,我们设置-d域的分割符为竖线,然后在通过-f指定提取第几个域即可,这里我们想要序列的Access Number,也就是文件中的NP和YP等字符。

cut -d 竖线来分隔域,分隔之后,这部分是第四个域和第八个域的内容,我们设置-f即可。

在这里插入图片描述

更多关于cut命令的功能,可以通过man cut或者cut --help查看。

在这里插入图片描述

---------- END ----------

欢迎关注我们的微信公众号:基因学苑
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
校园失物招领系统管理系统按照操作主体分为管理员和用户。管理员的功能包括字典管理、论坛管理、公告信息管理、失物招领管理、失物认领管理、寻物启示管理、寻物认领管理、用户管理、管理员管理。用户的功能等。该系统采用了Mysql数据库,Java语言,Spring Boot框架等技术进行编程实现。 校园失物招领系统管理系统可以提高校园失物招领系统信息管理问题的解决效率,优化校园失物招领系统信息处理流程,保证校园失物招领系统信息数据的安全,它是一个非常可靠,非常安全的应用程序。 ,管理员权限操作的功能包括管理公告,管理校园失物招领系统信息,包括失物招领管理,培训管理,寻物启事管理,薪资管理等,可以管理公告。 失物招领管理界面,管理员在失物招领管理界面中可以对界面中显示,可以对失物招领信息的失物招领状态进行查看,可以添加新的失物招领信息等。寻物启事管理界面,管理员在寻物启事管理界面中查看寻物启事种类信息,寻物启事描述信息,新增寻物启事信息等。公告管理界面,管理员在公告管理界面中新增公告,可以删除公告。公告类型管理界面,管理员在公告类型管理界面查看公告的工作状态,可以对公告的数据进行导出,可以添加新公告的信息,可以编辑公告信息,删除公告信息
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值