学习笔记Day13:Linux进阶

Linux进阶

Vim——Linux自带的文本编辑器

功能强大

在这里插入图片描述

命令模式
  • 使用 vim <file>进入后的默认模式
  • 可以上下左右移动光标
    • 方向键/hjkl
    • 快速到所在行的开头^/末尾$
    • 向下移动30行30j(上左右同)
    • 上下翻页Ctrl+f向上,Ctrl+b向下翻页
    • 快速回到文件第一行的第一个字符gg
    • 快速回到文件底部第一个字符G
  • 可以剪切字符/整行、也可以复制粘贴
    • 剪切x,连续剪切10个字符10x
    • 剪切所在行dd,剪切所在行及向下共10行10dd
    • 粘贴到所在行的下面p/上面P粘贴
    • 复制光标所在行yy,复制所在行及下面10行10yy
  • 撤销u
  • 重做上一个动作Ctrl+r
编辑模式

输入i后进入编辑模式

Esc退出编辑模式

末行模式

在命令模式下输入:

Esc退出该模式

  • 在该模式下可以设置、查询、替换、保存并退出
  • 保存退出
    • 保存并退出wq
    • 直接退出q
    • 不保存修改,强制退出q!
  • 查询
    • 输入/<KEYWORD>进行查询
    • n向下查找,按N向上查找
  • 替换
    • :%s///g全局替换
    • :s///g替换光标所在行
    • :s///只替换光标所在行的第一次出现
set系列命令
  1. :set nu显示行号;:set nonu取消显示行号
  2. :set list显示不可见字符(分辨制表符表格等)
  3. :set nowrap单行显示
  4. :set ff-unix将文件格式转换为unix格式
    • ff file format文件格式
  • 不同平台关于回车键的设置不同:Windows: \r \n; Mac: \r; Linux: \n. 解决方法之一:vim中的:set ff-unix。解决方法之二:dos2unix (unix2mac…)
异常情况处理
  1. E325:ATTENTION

    swp文件:使用vim编辑的时候未保存产生的缓存的文件

    第一种情况为其他程序正在修改。

    第二种情况为保存修改之前和服务器断开连接。

    可以-r(recovery)恢复,恢复保存后删除缓存文件[swp]。

  2. vim的帮助文档:vimtutor zh_CN

文本处理的三驾马车

grep

一种强大的文本搜索工具,可以匹配正则表达式

  • 格式:grep [options] ‘pattern’ file

  • 常见参数

    • -w 精准查找某个关键词word

    • -c统计匹配成功的行的数量

    • -v 反向选择,输出没有匹配的行

    • -n 显示匹配成功的行的所在行号

    • -r 从目录中查找pattern,显示所在行

      在目录中的所有文件中查找(不会查找压缩文件)

    • -e 指定多个匹配模式

      cat file | grep -w -e 'exon' -e 'UTR'  #-e和pattern成对出现
      
    • -f 从指定文件中读取要匹配的pattern

      使用vim把多个个关键词写入file2中,一行一个

    • -i 忽略大小写

  • 正则表达式

    • ^行首

    • $行尾

    • .换行符之外的任意单个字符

    • ? 匹配前一字符出现了0次/1次的情况(扩展正则表达式,需要使用\?或在参数位置使用-E开启优先正则表达式模式来匹配? )

    • + 匹配前一字符出现了1次/多次的情况(扩展正则)

    • * 匹配前一字符出现了0次/多次的情况

    • [] 匹配任意一个字符

      [AT]匹配A/T

    • [^] 排除字符

      [^aB]

    • |

sed

流编辑器,一般对文本进行增删改查

针对行进行的动作

  • 用法:sed [-options] ‘script’ file(s)

  • 常见参数[-options]

    • -n 禁止显示所有输入内容,只显示经过sed处理的行(常用)
    • -e 直接在命令模式上进行sed的动作编辑,接要执行的一个或多个命令
    • -f 执行含有sed动作的文件
    • -r sed的动作支持扩展正则
    • -i 直接修改读取的文件内容,会直接修改源文件
  • 动作script[address]command

    • address

      2:第2行

      2,4:第2-4行

      2,$:第2行到最后一行

      2~3:从第2行开始,每隔3行处理一次(2、5、8)

      2,+4:从第2行开始,到第2+4行

      /pattern/:匹配上pattern的行

      !:表示否定,取反,例如2!表示动作在除了第二行以外的行

    • command:增改删查

      a (append) 在指定行后增加一行,内容为a后面接的字符串

      i (insert) 在指定行的前增加一行,内容为i后面接的字符串

      d (delete) 删除某一行或某几行

      c (change) 改变指定行的内容

      s 更改或替换字符串,使用格式s/pattern/new/[flags],意为把pattern替换成new,flags表示替换第几个,1/2/g

      y 转换,实现字符一对一转换,格式y/abc/ABC 意为abc一对一替换成ABC,符号也支持

      p (print) 把匹配或修改过的行打印出来,通常与-n 参数合用

awk

也成为gawk,编程语言,可对文本和数据进行处理

  • 常见参数:

    -F (fields)设置字段分隔符

  • 用法:awk [options] ‘{script}’ file

    ##基础结构
    '{script}'
    ##匹配结构
    '/pattern/{script}'
    ##扩展结构
    'BEGIN{script} {script} END{script}'
    
  • awk使用预定义的字段分隔符划分每个数据字段,分配给一个变量。

    • $0 代表整个文本行

    • $1 代表文本行的第一个数据字段(列)

      。。。

    • $NF 代表文本行的最后一个数据字段(列)

  • 默认分隔符是任意空白字符(空格/制表符),也可以使用参数-F自定义分隔符

  • 内置变量:

    • FS 定义输入字段分隔符
    • RS 定义输入记录分隔符
    • OFS 定义输出字段分隔符
    • ORS 定义输出记录分隔符
    • NF 数据文件中的字段总数,简单理解为列数
    • NR 已处理的输入记录数,可以简单理解为行数
    cat Data/example.gtf | awk 'BEGIN{OFS= ":"} {print $3,$4,$5}' | head -5
    cat Data/example.gtf | awk 'BEGIN{FS="\t";OFS=";"} {print NR, $9}'|head -5
    
  • awk条件和循环语句

    • if条件判断

      awk '{if(条件) {yes} else {no}}'
      #例子
      awk'{if($3=="gene") print $0}'  ##类似R逻辑值去子集
      
  • awk数学运算

    在这里插入图片描述

  • cut的默认分隔符是分隔符,awk的列之间是根据写法不同改变。

Linux常见符号及其含义

在这里插入图片描述

引用自生信技能树课程~

今天内容比较多一些,还需要时间消化,还是先记下来以后慢慢理解~

  • 7
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值