1.字符串截取及切割
问题
使用Shell完成各种Linux运维任务时,一旦涉及到判断、条件测试等相关操作时,往往需要对相关的命令输出进行过滤,提取出符合要求的字符串。
本案例要求熟悉字符串的常见处理操作,完成以下任务练习:
参考PPT示范操作,完成子串截取、替换等操作
根据课上的批量改名脚本,编写改进版renfilex.sh:能够批量修改当前目录下所有文件的扩展名,修改前/后的扩展名通过位置参数$1、$2提供
方案
子串截取的三种用法:
v
a
r
:
起
始
位
置
:
长
度
e
x
p
r
s
u
b
s
t
r
"
{var:起始位置:长度} expr substr "
var:起始位置:长度exprsubstr"var" 起始位置 长度
echo
v
a
r
∣
c
u
t
−
b
起
始
位
置
−
结
束
位
置
路
径
分
割
:
取
目
录
位
置
:
d
i
r
n
a
m
e
"
字
符
串
"
取
文
档
的
基
本
名
称
:
b
a
s
e
n
a
m
e
"
字
符
串
"
子
串
替
换
的
两
种
用
法
:
只
替
换
第
一
个
匹
配
结
果
:
var | cut -b 起始位置-结束位置 路径分割: 取目录位置:dirname "字符串" 取文档的基本名称:basename "字符串" 子串替换的两种用法: 只替换第一个匹配结果:
var∣cut−b起始位置−结束位置路径分割:取目录位置:dirname"字符串"取文档的基本名称:basename"字符串"子串替换的两种用法:只替换第一个匹配结果:{var/old/new}
替换全部匹配结果:
v
a
r
/
/
o
l
d
/
n
e
w
字
符
串
掐
头
去
尾
:
从
左
向
右
,
最
短
匹
配
删
除
:
{var//old/new} 字符串掐头去尾: 从左向右,最短匹配删除:
var//old/new字符串掐头去尾:从左向右,最短匹配删除:{变量名#关键词}
从左向右,最长匹配删除:KaTeX parse error: Expected '}', got '#' at position 5: {变量名#̲#*关键词} 从右向左,最短匹…{变量名%关键词}
从右向左,最长匹配删除:${变量名%%关键词*}
步骤
实现此案例需要按照如下步骤进行。
步骤一:字符串的截取
1)方法一,使用
表
达
式
格
式
:
{}表达式 格式:
表达式格式:{var:起始位置:长度}
定义一个变量SCHOOL,并确认其字符串长度:
[root@svr5 ~]# SCHOOL=“Tarena IT Group.”
[root@svr5 ~]# echo KaTeX parse error: Expected '}', got '#' at position 2: {#̲SCHOOL} 16 …{}截取时,起始位置可以省略,省略时从第一个字符开始截。比如,以下操作都可以从左侧开始截取前6个字符:
[root@svr5 ~]# echo ${SCHOOL::6}
Tarena
或者
[root@svr5 ~]# echo
S
C
H
O
O
L
:
0
:
6
T
a
r
e
n
a
使
用
{SCHOOL:0:6} Tarena 使用
SCHOOL:0:6Tarena使用{}方式截取字符串时,起始位置是从0开始的(和数组下标编号类似) 。
因此,如果从起始位置1开始截取6个字符,那就变成这个样子了:
[root@svr5 ~]# echo KaTeX parse error: Expected 'EOF', got '#' at position 117: …: [root@svr5 ~]#̲ md5sum /etc/fs…(md5sum /etc/fstab) //保存到变量
[root@svr5 ~]# echo
M
D
5
S
T
R
:
:
32
/
/
截
取
前
32
个
字
符
(
M
D
5
值
的
固
定
长
度
)
e
e
f
0254
e
6049
a
411
d
c
30
d
b
864
c
0
e
e
6
e
a
2
)
方
法
二
,
使
用
e
x
p
r
s
u
b
s
t
r
格
式
:
e
x
p
r
s
u
b
s
t
r
"
{MD5STR::32} //截取前32个字符(MD5值的固定长度) eef0254e6049a411dc30db864c0ee6ea 2)方法二,使用 expr substr 格式:expr substr "
MD5STR::32//截取前32个字符(MD5值的固定长度)eef0254e6049a411dc30db864c0ee6ea2)方法二,使用exprsubstr格式:exprsubstr"var" 起始位置 长度
还以前面的SCHOOL变量为例,确认原始值:
[root@svr5 ~]# echo $SCHOOL
Tarena IT Group.
[root@svr5 ~]# echo KaTeX parse error: Expected '}', got '#' at position 2: {#̲SCHOOL} 16 使用ex…{}相区分。
从左侧截取SCHOOL变量的前6个字符:
[root@svr5 ~]# expr substr “$SCHOOL” 1 6
Tarena
这里注意,因为SCHOOL变量的值里含有空格,所以应该加双引号进行调用,否则是会报错的:
[root@svr5 ~]# expr substr KaTeX parse error: Expected 'EOF', got '#' at position 61: …: [root@svr5 ~]#̲ expr substr "SCHOOL" 11 16
Group.
应用示例:还是提取文件/etc/fstab的MD5SUM校验和字串,排除无关文本。若采用expr substr,则相关操作及结果如下所示:
[root@svr5 ~]# md5sum /etc/fstab //确认MD5SUM校验值
eef0254e6049a411dc30db864c0ee6ea /etc/fstab
[root@svr5 ~]# MD5STR=KaTeX parse error: Expected 'EOF', got '#' at position 44: …量 [root@svr5 ~]#̲ expr substr "MD5STR" 1 32 //截取前32个字符
eef0254e6049a411dc30db864c0ee6ea
3)方式三,使用cut分割工具
格式:echo $var | cut -b 起始位置-结束位置
选项 -b 表示按字节截取字符,其中起始位置、结束位置都可以省略。当省略起始位置时,视为从第1个字符开始(编号也是从1开始,与expr类似),当省略结束位置时,视为截取到最后。
还以前面的SCHOOL变量为例,确认原始值:
[root@svr5 ~]# echo $SCHOOL
Tarena IT Group.
[root@svr5 ~]# echo ${#SCHOOL}
16
从左侧截取前6个字符,可执行以下操作:
[root@svr5 ~]# echo $SCHOOL | cut -b 1-6
Tarena
或者
[root@svr5 ~]# echo $SCHOOL | cut -b -6
Tarena
截取第11-16个字符:
[root@svr5 ~]# echo $SCHOOL | cut -b 11-16
Group.
从第8个字符截取到末尾:
[root@svr5 ~]# echo $SCHOOL | cut -b 8-
IT Group.
只截取单个字符,比如第9个字符:
[root@svr5 ~]# echo $SCHOOL | cut -b 9
T
如果起始位置、结束位置同时省略,那就和直接echo变量值没啥区别了:
[root@svr5 ~]# echo KaTeX parse error: Expected 'EOF', got '#' at position 123: …: [root@svr5 ~]#̲ md5sum /etc/fs…{var/old/new}
以前面的SCHOOL变量作为测试,先确认变量值:
[root@svr5 ~]# echo $SCHOOL
Tarena IT Group.
将字符串中的第1个r替换为RRRR:
[root@svr5 ~]# echo
S
C
H
O
O
L
/
r
/
R
R
R
R
T
a
R
R
R
R
e
n
a
I
T
G
r
o
u
p
.
2
)
替
换
全
部
子
串
格
式
:
{SCHOOL/r/RRRR} TaRRRRena IT Group. 2)替换全部子串 格式:
SCHOOL/r/RRRRTaRRRRenaITGroup.2)替换全部子串格式:{var//old/new}
以前面的SCHOOL变量作为测试,先确认变量值:
[root@svr5 ~]# echo $SCHOOL
Tarena IT Group.
将字符串中的所有r都替换为RRRR:
[root@svr5 ~]# echo ${SCHOOL//r/RRRR}
TaRRRRena IT GRRRRoup.
3)应用示例,根据变量值重设主机名
用法分解,将当前主机名的域后缀替换为“localdomain”:
[root@svr5 ~]# echo $HOSTNAME //确认当前的主机名
svr5.tarena.com
[root@svr5 ~]# echo ${HOSTNAME/tarena.com/localdomain}
svr5.localdomain //替换后的字串
将当前主机名整个替换为“localhost.localdomain”:
[root@svr5 ~]# echo KaTeX parse error: Expected '}', got 'EOF' at end of input: {HOSTNAME/HOSTNAME/localhost.localdomain}
localhost.localdomain
假设要设置的新主机名保存在变量MYFQDN内,则重设操作如下所示:
[root@svr5 ~]# MYFQDN=“dbsvr.example.org” //新主机名变量
[root@svr5 ~]# hostname KaTeX parse error: Expected '}', got 'EOF' at end of input: {HOSTNAME/HOSTNAME/$MYFQDN} //重设操作
[root@svr5 ~]# hostname //确认修改后的主机名
dbsvr.example.org
如果希望恢复为原来的主机名,只要修改变量MYFQDN的值,然后再重新执行一遍替换操作即可:
[root@svr5 ~]# MYFQDN=“svr5.tarena.com” //定义要恢复的主机名
[root@svr5 ~]# hostname KaTeX parse error: Expected '}', got 'EOF' at end of input: {HOSTNAME/HOSTNAME/$MYFQDN} //重设主机名
[root@svr5 ~]# hostname //确认恢复结果
svr5.tarena.com
引入变量来保存主机名以后,可以使Shell脚本具有更广泛的适用性。
步骤三:字符串的匹配删除
以处理系统默认的邮箱路径为例,可直接使用环境变量MAIL:
[root@svr5 ~]# echo
M
A
I
L
/
v
a
r
/
s
p
o
o
l
/
m
a
i
l
/
r
o
o
t
1
)
从
左
向
右
,
最
短
匹
配
删
除
格
式
:
MAIL /var/spool/mail/root 1)从左向右,最短匹配删除 格式:
MAIL/var/spool/mail/root1)从左向右,最短匹配删除格式:{变量名#关键词}
删除从左侧第1个字符到最近的关键词“oo”的部分, 作通配符理解:
[root@svr5 ~]# echo ${MAIL#oo}
l/mail/root
删除从左侧第1个字符到最近的关键词“/”的部分:
[root@svr5 ~]# echo KaTeX parse error: Expected '}', got '#' at position 6: {MAIL#̲*/} var/spool/m…{变量名##关键词}
删除从左侧第1个字符到最远的关键词“oo”的部分:
[root@svr5 ~]# echo $MAIL //确认变量MAIL的值
/var/spool/mail/root
[root@svr5 ~]# echo ${MAIL##oo}
t
删除从左侧第1个字符到最远的关键词“/”的部分:
[root@svr5 ~]# echo ${MAIL##/}
root
操作 ${MAIL##/} 的效果与使用basename命令提取基本名称的效果相同:
[root@svr5 ~]# basename
M
A
I
L
r
o
o
t
3
)
从
右
向
左
,
最
短
匹
配
删
除
格
式
:
MAIL root 3)从右向左,最短匹配删除 格式:
MAILroot3)从右向左,最短匹配删除格式:{变量名%关键词}
删除从右侧最后1个字符到往左最近的关键词“oo”的部分,* 做通配符理解:
[root@svr5 ~]# echo $MAIL //确认变量MAIL的值
[root@svr5 ~]# echo ${MAIL%oo*}
/var/spool/mail/r
删除从右侧最后1个字符到往左最近的关键词“/”的部分:
[root@svr5 ~]# echo ${MAIL%/}
/var/spool/mail
操作 ${MAIL%/} 的效果与使用dirname命令提取目录名称的效果相同:
[root@svr5 ~]# dirname
M
A
I
L
/
v
a
r
/
s
p
o
o
l
/
m
a
i
l
4
)
从
右
向
左
,
最
长
匹
配
删
除
格
式
:
MAIL /var/spool/mail 4)从右向左,最长匹配删除 格式:
MAIL/var/spool/mail4)从右向左,最长匹配删除格式:{变量名%%关键词*}
删除从右侧最后1个字符到往左最远的关键词“oo”的部分:
[root@svr5 ~]# echo $MAIL //确认变量MAIL的值
/var/spool/mail/root
root@svr5 ~]# echo ${MAIL%%oo*}
/var/sp
删除从右侧最后1个字符到往左最远的关键词“/”的部分(删没了):
[root@svr5 ~]# echo ${MAIL%%/*}
[root@svr5 ~]#
步骤四:编写renfilex.sh脚本
1)验证原始改名脚本renfile.sh的效果
脚本用途为:批量修改当前目录下的文件扩展名,将.doc改为.txt。
脚本内容参考如下:
[root@svr5 ~]# vim renfile.sh
#!/bin/bash
for FILE in *.doc
do
mv $FILE ${FILE%.doc}.txt
done
[root@svr5 ~]# chmod +x renfile.sh
创建一个测试用的文件夹rendir,并在其下建几个测试文件
[root@svr5 ~]# mkdir rendir
[root@svr5 ~]# cd rendir
[root@svr5 rendir]# touch file1.doc abcde.doc xxyyzz.doc other1.xls killbill.mp4
[root@svr5 rendir]# ls
abcde.doc file1.doc killbill.mp4 other1.xls xxyyzz.doc
调用renfile.sh脚本,查看修改结果(原来扩展名为.doc的文件,其扩展名都变成了.txt):
[root@svr5 rendir]# …/renfile.sh
[root@svr5 rendir]# ls
abcde.txt file1.txt killbill.mp4 other1.xls xxyyzz.txt
2)建立改进版脚本renfilex.sh
要适应不同扩展名文件的修改,并能够反向还原。
修改前的扩展名、修改后的扩展名通过位置变量 $1、$2提供。
改进的脚本编写参考如下:
[root@svr5 rendir]# cp …/renfile.sh …/renfilex.sh
[root@svr5 rendir]# vim …/renfilex.sh
#!/bin/bash
for FILE in “$1”
do
mv $FILE ${FILE%$1}"$2"
done
3)验证、测试改进后的脚本
将 *.doc文件的扩展名改为.txt:
[root@svr5 rendir]# ls //修改前
abcde.txt file1.txt killbill.mp4 other1.xls xxyyzz.txt
[root@svr5 rendir]# …/renfilex.sh .txt .doc
[root@svr5 rendir]# ls //修改后
abcde.doc file1.doc killbill.mp4 other1.xls xxyyzz.doc
将 *.mp4文件的扩展名改为.mkv:
[root@svr5 rendir]# ls //修改前
abcde.doc file1.doc killbill.mp4 other1.xls xxyyzz.doc
[root@svr5 rendir]# …/renfilex.sh .mp4 .mkv
[root@svr5 rendir]# ls //修改后
abcde.doc file1.doc killbill.mkv other1.xls xxyyzz.doc