linux 正则匹配字符串,shell脚本regex正则表达式和字符串替换

最新推荐文章于 2023-10-16 14:48:44 发布

迷影生活

最新推荐文章于 2023-10-16 14:48:44 发布

阅读量1.2k

点赞数 1

文章标签： linux 正则匹配字符串

任意字符

^行首匹配

$行尾匹配

^$表示空行,不含字符的行

^ $匹配只有单个空格的行

[0-9]

[a-zA-Z]

^[A- Z]搜索以大写字母开头的行

[^A-Z]匹配大写字母意外的任意字符

*表示匹配0个或若干个字符，如:a*,表示匹配0个或若干个a; aa*表示匹配至少1个a

.*来表示0或若干个任意字符

e.e*表示匹配第一个e和最后一个e之间的任意字符

[-0-9]匹配一个连字符或数字

[]a-z]匹配一个]或者字母

\{min,max\}匹配任意数目的字符串

[a-z]\{10\}只匹配10个 a-z字符的字符串

s/.\{5\}$// 删除每行的最后5个字符

$...$,n是1到9的数字,表示存储用的寄存器,用\n来引用存在寄存器中的内容

^$.$\1匹配行首的第一个字符,并将该字符存到1号寄存器中,然后匹配1号寄存器中的内容,这由\1的描述。该正则表达式的最终效果是,如果一行的头两个字符相同,就匹配他们。

^$.$.*\1$匹配一行中的头一个字符(^.)跟最后一个字符(\1$)相同的行。.*匹配中间的所有内容

^$...$$...$行中头三个字符存在1号寄存器,接着的三个字符存在2号寄存器.

s/$.*$ $.*$/\2 \1/g 交换两个字段

.任何字符

^行首

$行尾

*前导的正则表达式重复0或若干次

[字符表]字符中的任一字符

a..表示a后的2个字符

^wood表示行首的wood

x$表示行为的x

^INSERT$只包含字符串INSERT的行

^$不包含任何字符的行

x*表示0或若干个连续的x

xx*表示1或多个连续的x

.*表示0活若干个字符

w.*s表示以w开始,s结尾的任何字符串

[tT]小写或大写的t

[^字符表]表示任一不在字符表中的字符 [^0-9] [^a-zA-Z]

\{min,max\}表示前导的正则表达式重复只烧min次,至多max次[0-9]\{3,9\}表示3到 9个数字

$...$表示将小括号中匹配的字符串存储到下一个寄存器中(1-9),

^$.$表示行中第1个字符存到1号寄存器

^\ (.\)\1表示行首恋歌字符,且他们相同

cut -c5 file把file文件中没行的第5个字符析取出来;

用逗号分割的数值列表,如-c1,13,50把第1,13,50个字符析取出来

cut -c20-50把第20到50之间的字符析取出来

如

who | cut -c1-8

who | cut -c1-8,18- 析取行中的第1到8个字符(用户名)和第18到行尾的字符(登录时间)

cut -ddchar -ffields file其中,dchar是数据中分割各字段的分割符,fields表示要从文件file中析取出来的字段.

字段编号从1开始,而且格式跟以前将的用来指定字符位置的数字一样(如-f1、2、8、-f1-3、-f4-)。

cut -d: -f1 /etc/passwd

如果已知字段之间使用制表符分隔的,就可以给cut命令用-f选项而不用-c选项,好多了！还记得吧,这里用不着用-d选项来指定分割符,因为

cut把制表符默认为分割符。

paste和cut正好相反,它不是把行分离开,而是把多行合并在一起。

paste names numbrs文件names中的每一行都和numbers中的对应行显示在一起,中间用制表符分割。

如果不想用制表符作默认分割, 可以使用-dchars指定分割符

paste -d'+' names addresses numbers

-s选项告诉paste把同一文件中的行粘贴在一起,而不是从其他文件。如果只指定一个文件名,其效果是把文件中的所有行合并成一行,原来隔行之间用制表符或者有-d选项指定的分割符分割。

sed是用来编辑数据的程序,意指流编辑器(stream editor)。与ed不同,sed不能用于交互,

-n选项,然后使用p命令显式指定

sed -n '1,2p' file只显示前2行

sed -n '/Unix/p' file只打印包含Unix的行

删除行

d删除整行文件

sed '1,2d' file删除1和2行

记住sed默认把输入的所有行写入标准输出,所以生于行的文字,也就是从第3行到结尾,都被写入标准输出。

sed '5d'删除第5行

sed '/[Tt]est/d'删除包含test或Test的行

sed -n '20,25p' test只显示文件test的第20行到第25行

sed '1,10s/unix/UNIX/g' intro报intro前10行中的unix改为UNIX

sed '/jan/s/-1/-5/'将所有包含jan的行中第1个-1改为-5

sed 's/...//' data删除data文件每一行的前3个字符

sed 's/...$//' data删除data文件每一行的最后3个字符

sed -n 'I' text显示文件text的所有行,把所有不可打印字符显示为\nn,制表符显示为\t

过滤器tr用来转换来自标准输入的字符,tr命令的一般格式为

tr from-chars to-chars

tr e x < intro把所有字母e转换成x

tr命令的输入必须重定向到文件intro,因为tr总是从标准输入获得输入;转换的结果写入标准输出,而原始文件保持不变。

cut -d: -f1,6 /etc/passwd | tr : ' ' 通过在管道线的最后加上适当的tr命令,就可以把冒号转换成制表符,这样产生的输出更容易看

单引号中括的是制表符(尽管你看不到)。必须将它括在引号中,以便穿过shell,使tr有机会看到它。

使用\nnn来给tr提供8进制表示的字符

一些ascii字符的八进制值

响铃 7

退格 10

制表符 11

新行 12

换行 12

换页 14

回车 15

转义 33

date | tr ' ' '\12'此例中,tr接受date命令的输出,并把所有的空格转换成换行

tr '[a-z]' '[A-Z]'

-s选项,tr命令中的-s选项用来压缩to-chars中重复的字符,换句话说,如果转换完成后,有 to-chars中的某个字符连续出现多次,则这些连续相同的字符被替换为一个字符。

如下面的命令将冒号转换为制表符,并将多个连续制表符替换为单个制表符：

tr -s ':' '\11\'

tr -s ' ' ' '

-d选项用来删除掉输入流中的字符,其一般格式为

tr -d from-chars任何列在from-chars中的字符都会被从标准输入中删除。下例用tr来删除文件intro中的所有空格:

tr -d ' '

当然sed 's/ //g' intro也可以得到同样的效果

tr 'X' 'x' 把大X专成小x

tr '()' '{}' 把所有左小括号转换成左大括号,右小括号专成右大括号

tr '[a-z]' '[A-Z]' 把小写转大写

tr '[A-Z]' '[N-ZA-M]' 把A-M字母分别专成N-Z把N-Z转成A-M

tr ' ' ''把所有制表符转换成空格

tr -s ' ' ''把多个空格转换成单个空格

tr -d '\14' 删除所有换页字符(八进制14)

tr -d '[0-9]'删除所有数字

grep '[A-Z]' list list中包含一个大写字母的行

grep '[0-9]' data中包含数字的行

grep '[A-Z]...[0-9]' list list中包含以大写字母开始、数字结尾的5个字符组合的行

grep '\.pic$' filelist filelist中以.pic结尾的行

uniq in_file

out_file该格式中,uniq把in_file复制到out_file,处理过程中,去掉其中的重复行。如果不指定第2个参数out_file,结

果就写入标准输出；如果in_file没有指定,那么uniq就成了一个过滤器,从标准输入读取输入。

>或

>>或<< 重定向,想文件末尾追加内容

tee 显示在终端上的内容存储到文件 ls | tee >glx

-d 目录

-e 存在

-f 普通文件

-r 进程可读文件

-s 长度不为0

-w 进程可写文件

-x 可执行

-L 链接文件

$# 传给程序的参数个数,或者执行set命令设置的参数个数

$* 对位置参数等的集中引用

$@ 跟$*相似,区别在于当加入双引号后("$@"),集中引用位置参数"$1","$2"...等

$0 正执行的程序名

$$ 正执行程序的进程id

$! 最后一个发生后台运行的程序的进程id

$? 最后一个在前台执行的程序的退出状态

$- 当前有效选项标志

`command`符号之间的内容为需要执行的命令

make -C /lib/modules/`uname -r`/build M=`pwd`

使用echo可以显示字符串,但是不能格式化字符串,可以使用printf实现

printf "format" arg1 arg2 ...

ln -s from to 把from链接到to上,所以to是from的符号链接

tree -d只显示目录

tree -L 2显示2级目录

字符串比较

s1 = s2 s1等于s2

s1 != s2 s1不等于s2

s1 s1不为空

-n s1 s1不为空

-z s1 s1为空

整数比较操作

-eq 等于

-ge 大于或等于

-gt 大于

-le 小于或等于

-lt 小于

-ne 不等于

[ "$x1" = 5 ]字符串比较

[ "$x1" -eq 5 ]整数比较

-a 逻辑与操作

-o 逻辑或操作

command1 && command2

则先执行command1,如果返回的退出状态为0,则执行command2;如果command1返回的退出状态非0,则跳过command2

command1 || command2

和上边的&&差不多,只是,仅仅当command1返回非0时,才执行command2

#!/bin/sh

append2=0

include_lib=1

if [ -f cscope_i ];then

rm cscope_i

for cscope_file in $*; do

if [ -f "$cscope_file" ] || [ -d "$cscope_file" ];then

# if [ $cscope_file = '-a' ];then

# append2=1

# continue

# fi

# if [ $cscope_file = '-n' ];then

# include_lib=0

# continue

# fi

if [ "$append2" = "1" ];then

find $cscope_file -maxdepth 1 -name '*.[cChH]' -o -name '*.[cC][pP][pP]'>>cscope_i

else

find $cscope_file -name '*.[cChH]' -o -name '*.[cC][pP][pP]'>>cscope_i

else

if [ $cscope_file = '-a' ];then

append2=1

elif [ $cscope_file = '-n' ];then

include_lib=0

else

echo "Error: cannot read file $cscope_file"

done

if [ -f cscope_i ];then

if [ "$include_lib" = "1" ];then

cscope -bi cscope_i

else

cscope -bki cscope_i

rm cscope_i

迷影生活

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
linux 正则匹配字符串,shell脚本regex正则表达式和字符串替换

任意字符^行首匹配$行尾匹配^$表示空行,不含字符的行^ $匹配只有单个空格的行[0-9][a-zA-Z]^[A- Z]搜索以大写字母开头的行[^A-Z]匹配大写字母意外的任意字符*表示匹配0个或若干个字符，如:a*,表示匹配0个或若干个a; aa*表示匹配至少1个a.*来表示0或若干个任意字符e.e*表示匹配第一个e和最后一个e之间的任意字符[-0-9]匹配一个连字符或数字[]a-z]匹配一个...
复制链接

扫一扫