Linux文本处理

目录:
        1.正则表达式
        2.字符串截取命令
                1.cut命令
                2.printf命令
                3.awk命令
       3.字符串处理命令
                1.排序命令sort
                2.统计命令wc

-------------------------------正则表达式------------------------------------

正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep,awk,sed等命令可以支持 正则表达式 通配符用来匹配符合条件的文件名,通配符是完全匹配。ls,find,cp这些命令不支持正则表达式,所 以只能使用shell自己的通配符来进行匹配

元字符     作用
*         前一个字符匹配0次或任意多次
.         匹配除了换行符外任意一个字符
?         匹配前面的子表达式0到1次
^         匹配行首。例如:^hello会匹配以hell开头的行
$         匹配行尾。例如:hello$会匹配以hello结尾的行
[]         匹配括号中指定的任意一个字符,只匹配一个字符。例如:[aeiou]匹配任意一个元音
字母,[0-9]匹配任意一位数字,[a-z][0-9]匹配小写字母和一位数字构成的两位字符
[^]         匹配除中括号以外的任意一个字符。例如:[^0-9]匹配任意一个非数字字符,[^a-z]
表示任意一位非小写字母。
\         转义符。用于取消符号的特殊含义
\{n\}         表示其前面的字符恰好出现n次。例如:[0-9]\{4\}匹配4位数字,[1][3-9][0-9]\
{9\}        匹配手机号码
\{n, \}     表示其前面的字符出现不小于n次。例如:[0-9]\{2, \}表示两位及以上的数字
\{n, m\}     表示其前面的字符至少出现n次,最多出现m次。例如:[a-z]\{6, 8\}匹配6到8位的小写字母

 ---------------------------字符串截取命令-------------------------

cut命令

        -f        列号:提取第几列

        -d        分隔符:按照指定分隔符分割列

例:       

 vim student.txt

--内容

--cut -f 2,4 student.txt(仅显示2,4列两列的内容)

--以":"为分隔符 查看/etc/passwd的1,3行内容

cut -d ":" -f 1,3 /etc/passwd

-----------------printf命令------------------

语法:printf '输出类型输出格式' 输出内容

举例:

[root@localhost ~]# printf %s 1 2 3 4 1234

[root@localhost ~]# printf '%s\t%s%s' 1 2 3 4 5 12345

-----------awk命令-----------------

语法:awk '条件1{动作1}条件2{动作2}...' 文件名

1、条件(pattern): 一般使用关系表达式作为条件

x > 10 判断变量x是否大于10 x >= 10 大于等于 x 小于等于

2、动作(Action): 格式化输出 流程控制语句

例:awk '$4 > 50{printf$1 "\t" $4}' student.txt

df -h | awk '{print $1 "\t" $5 "\t" $6}'

#查看第一个分区的信息

df -h | grep sda1

BEGIN  #在开头添加信息

awk 'BEGIN{printf "This is a transcript \n"}{printf$2 "\t" $6 "\n"}' student.txt

FS内置变量  #指定分隔符

cat /etc/passwd|grep "bin/bash"|awk 'BEGIN {FS=":"} {printf$1 "\t" $3 "\n"}'

------------------字符串处理命令--------------------

排序命令sort

语法:sort [选项] 文件名

选项 -f        忽略大小写

        -n        以数值型进行排序,默认使用字符串型排序

        -r        反向排序

        -t        指定分隔符,默认是分隔符是制表符

        -k n,m        按照指定的字段范围排序。从第n字段开始,m字段结束(默认到行尾

举例:

sort /etc/passwd

sort -r /etc/passwd

sort -t ":" -k 3,3 /etc/passwd 指定分隔符就是“:”,用第三字段开头,第三字段结尾排序,就是只 用第三字段排序

-----------------统计命令wc-------------------

语法: wc [选项] 文件名

选项   -l         只统计行数

         -w        只统计单词数

         -n        只统计字符数

  • 12
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值