正则表达式
一、正则表达式
二、字符截取命令
一 正则表达式是什么
正则表达式是用于描述字符排列和匹配模式的一种语法规则。
它主要用于字符串的模式分割、匹配、查找及替换操作。
正则表达式与通配符
通配符
* 匹配任意内容
? 匹配任意一个内容
[]匹配中括号中的一个字符
正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep,awk,sed等命令可以支持正则表达式。
通配符用来匹配符合条件的文件名,通配符是完全匹配。ls,find,cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹
配了。
基础正则表达式
二 字符截取命令
1 cut字段提取命令
cut [选项] 文件名
选项:
-f 列号:
-d 分割符:
2 printf命令
printf '输出类型输出格式' 输出内容
输出类型:
%ns : 输出字符串。n是数字指代输出几个字符
%ni : 输出整数。n是数字指代输出几个数字
%m.nf: 输出浮点数。m和n是数字,指代输出的整数位数和小数位数
如%8.2f代表共输出8位数,其中2位是小数,6位是整数
输出格式
\n 换行
\t 水平输出退格键
\v 垂直输出退格键换行符
3 awk命令
在awk命令的输出中支持print和printf命令
print:print会在每个输出之后自动加入一个换行符(Linux默认没有print命令)
printf:printf是标准格式输出命令,并不会自动加入换行符,如果需要换行,需要手动加入
awk '条件1{动作1}条件2{动作2}...' 文件名
条件(Pattern)
一般使用关系表达式作为条件
x>10判断变量x是否大于10
动作(Action)
格式化输出
流程控制语句
4 sed命令
sed是一种几乎包括在所有UNIX平台(包括Linux)的轻量级流编辑器。sed主要是用来将数据进行选取、替换、删除、新增的命令。
sed [选项] '[动作]' 文件名
选项:
-n:一般sed命令会把所有数据都输出到屏幕,如果加入此选择则会把经过sed命令处理的行输出到屏幕
-e:允许对输入数据应用多条sed命令编辑
-i:用sed的修改结果直接修改读取数据的文件,而不是由屏幕输出
动作:
a:追加
c:行替换
i:插入
d:删除
p:打印
s:字串替换
字符处理命令
5 sort命令
sort [选项] 文件名
选项:
-f:忽略大小写
-n:以数值型进行排序
-r:反向排序
-t:制定分隔符
-k n[,m]:按照制定的字段范围排序
6 wc命令
wc [选项] 文件名
选项:
-l:只统计行数
-w:只统计单词数
-m:只统计字符数
一、正则表达式
二、字符截取命令
一 正则表达式是什么
正则表达式是用于描述字符排列和匹配模式的一种语法规则。
它主要用于字符串的模式分割、匹配、查找及替换操作。
正则表达式与通配符
通配符
* 匹配任意内容
? 匹配任意一个内容
[]匹配中括号中的一个字符
正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep,awk,sed等命令可以支持正则表达式。
通配符用来匹配符合条件的文件名,通配符是完全匹配。ls,find,cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹
配了。
基础正则表达式
二 字符截取命令
1 cut字段提取命令
cut [选项] 文件名
选项:
-f 列号:
-d 分割符:
2 printf命令
printf '输出类型输出格式' 输出内容
输出类型:
%ns : 输出字符串。n是数字指代输出几个字符
%ni : 输出整数。n是数字指代输出几个数字
%m.nf: 输出浮点数。m和n是数字,指代输出的整数位数和小数位数
如%8.2f代表共输出8位数,其中2位是小数,6位是整数
输出格式
\n 换行
\t 水平输出退格键
\v 垂直输出退格键换行符
3 awk命令
在awk命令的输出中支持print和printf命令
print:print会在每个输出之后自动加入一个换行符(Linux默认没有print命令)
printf:printf是标准格式输出命令,并不会自动加入换行符,如果需要换行,需要手动加入
awk '条件1{动作1}条件2{动作2}...' 文件名
条件(Pattern)
一般使用关系表达式作为条件
x>10判断变量x是否大于10
动作(Action)
格式化输出
流程控制语句
4 sed命令
sed是一种几乎包括在所有UNIX平台(包括Linux)的轻量级流编辑器。sed主要是用来将数据进行选取、替换、删除、新增的命令。
sed [选项] '[动作]' 文件名
选项:
-n:一般sed命令会把所有数据都输出到屏幕,如果加入此选择则会把经过sed命令处理的行输出到屏幕
-e:允许对输入数据应用多条sed命令编辑
-i:用sed的修改结果直接修改读取数据的文件,而不是由屏幕输出
动作:
a:追加
c:行替换
i:插入
d:删除
p:打印
s:字串替换
字符处理命令
5 sort命令
sort [选项] 文件名
选项:
-f:忽略大小写
-n:以数值型进行排序
-r:反向排序
-t:制定分隔符
-k n[,m]:按照制定的字段范围排序
6 wc命令
wc [选项] 文件名
选项:
-l:只统计行数
-w:只统计单词数
-m:只统计字符数