字符串截取及切割

19 篇文章 0 订阅

1.字符串截取及切割
问题
使用Shell完成各种Linux运维任务时,一旦涉及到判断、条件测试等相关操作时,往往需要对相关的命令输出进行过滤,提取出符合要求的字符串。
本案例要求熟悉字符串的常见处理操作,完成以下任务练习:
参考PPT示范操作,完成子串截取、替换等操作
根据课上的批量改名脚本,编写改进版renfilex.sh:能够批量修改当前目录下所有文件的扩展名,修改前/后的扩展名通过位置参数$1、$2提供
方案
子串截取的三种用法:
v a r : 起 始 位 置 : 长 度 e x p r s u b s t r " {var:起始位置:长度} expr substr " var::exprsubstr"var" 起始位置 长度
echo v a r ∣ c u t − b 起 始 位 置 − 结 束 位 置 路 径 分 割 : 取 目 录 位 置 : d i r n a m e " 字 符 串 " 取 文 档 的 基 本 名 称 : b a s e n a m e " 字 符 串 " 子 串 替 换 的 两 种 用 法 : 只 替 换 第 一 个 匹 配 结 果 : var | cut -b 起始位置-结束位置 路径分割: 取目录位置:dirname "字符串" 取文档的基本名称:basename "字符串" 子串替换的两种用法: 只替换第一个匹配结果: varcutbdirname""basename""{var/old/new}
替换全部匹配结果: v a r / / o l d / n e w 字 符 串 掐 头 去 尾 : 从 左 向 右 , 最 短 匹 配 删 除 : {var//old/new} 字符串掐头去尾: 从左向右,最短匹配删除: var//old/new{变量名#关键词}
从左向右,最长匹配删除:KaTeX parse error: Expected '}', got '#' at position 5: {变量名#̲#*关键词} 从右向左,最短匹…{变量名%关键词
}
从右向左,最长匹配删除:${变量名%%关键词*}
步骤
实现此案例需要按照如下步骤进行。
步骤一:字符串的截取
1)方法一,使用 表 达 式 格 式 : {}表达式 格式: {var:起始位置:长度}
定义一个变量SCHOOL,并确认其字符串长度:
[root@svr5 ~]# SCHOOL=“Tarena IT Group.”
[root@svr5 ~]# echo KaTeX parse error: Expected '}', got '#' at position 2: {#̲SCHOOL} 16 …{}截取时,起始位置可以省略,省略时从第一个字符开始截。比如,以下操作都可以从左侧开始截取前6个字符:
[root@svr5 ~]# echo ${SCHOOL::6}
Tarena
或者
[root@svr5 ~]# echo S C H O O L : 0 : 6 T a r e n a 使 用 {SCHOOL:0:6} Tarena 使用 SCHOOL:0:6Tarena使{}方式截取字符串时,起始位置是从0开始的(和数组下标编号类似) 。
因此,如果从起始位置1开始截取6个字符,那就变成这个样子了:
[root@svr5 ~]# echo KaTeX parse error: Expected 'EOF', got '#' at position 117: …: [root@svr5 ~]#̲ md5sum /etc/fs…(md5sum /etc/fstab) //保存到变量
[root@svr5 ~]# echo M D 5 S T R : : 32 / / 截 取 前 32 个 字 符 ( M D 5 值 的 固 定 长 度 ) e e f 0254 e 6049 a 411 d c 30 d b 864 c 0 e e 6 e a 2 ) 方 法 二 , 使 用 e x p r s u b s t r 格 式 : e x p r s u b s t r " {MD5STR::32} //截取前32个字符(MD5值的固定长度) eef0254e6049a411dc30db864c0ee6ea 2)方法二,使用 expr substr 格式:expr substr " MD5STR::32//32MD5eef0254e6049a411dc30db864c0ee6ea2使exprsubstrexprsubstr"var" 起始位置 长度
还以前面的SCHOOL变量为例,确认原始值:
[root@svr5 ~]# echo $SCHOOL
Tarena IT Group.
[root@svr5 ~]# echo KaTeX parse error: Expected '}', got '#' at position 2: {#̲SCHOOL} 16 使用ex…{}相区分。
从左侧截取SCHOOL变量的前6个字符:
[root@svr5 ~]# expr substr “$SCHOOL” 1 6
Tarena
这里注意,因为SCHOOL变量的值里含有空格,所以应该加双引号进行调用,否则是会报错的:
[root@svr5 ~]# expr substr KaTeX parse error: Expected 'EOF', got '#' at position 61: …: [root@svr5 ~]#̲ expr substr "SCHOOL" 11 16
Group.
应用示例:还是提取文件/etc/fstab的MD5SUM校验和字串,排除无关文本。若采用expr substr,则相关操作及结果如下所示:
[root@svr5 ~]# md5sum /etc/fstab //确认MD5SUM校验值
eef0254e6049a411dc30db864c0ee6ea /etc/fstab
[root@svr5 ~]# MD5STR=KaTeX parse error: Expected 'EOF', got '#' at position 44: …量 [root@svr5 ~]#̲ expr substr "MD5STR" 1 32 //截取前32个字符
eef0254e6049a411dc30db864c0ee6ea
3)方式三,使用cut分割工具
格式:echo $var | cut -b 起始位置-结束位置
选项 -b 表示按字节截取字符,其中起始位置、结束位置都可以省略。当省略起始位置时,视为从第1个字符开始(编号也是从1开始,与expr类似),当省略结束位置时,视为截取到最后。
还以前面的SCHOOL变量为例,确认原始值:
[root@svr5 ~]# echo $SCHOOL
Tarena IT Group.
[root@svr5 ~]# echo ${#SCHOOL}
16
从左侧截取前6个字符,可执行以下操作:
[root@svr5 ~]# echo $SCHOOL | cut -b 1-6
Tarena
或者
[root@svr5 ~]# echo $SCHOOL | cut -b -6
Tarena
截取第11-16个字符:
[root@svr5 ~]# echo $SCHOOL | cut -b 11-16
Group.
从第8个字符截取到末尾:
[root@svr5 ~]# echo $SCHOOL | cut -b 8-
IT Group.
只截取单个字符,比如第9个字符:
[root@svr5 ~]# echo $SCHOOL | cut -b 9
T
如果起始位置、结束位置同时省略,那就和直接echo变量值没啥区别了:
[root@svr5 ~]# echo KaTeX parse error: Expected 'EOF', got '#' at position 123: …: [root@svr5 ~]#̲ md5sum /etc/fs…{var/old/new}
以前面的SCHOOL变量作为测试,先确认变量值:
[root@svr5 ~]# echo $SCHOOL
Tarena IT Group.
将字符串中的第1个r替换为RRRR:
[root@svr5 ~]# echo S C H O O L / r / R R R R T a R R R R e n a I T G r o u p . 2 ) 替 换 全 部 子 串 格 式 : {SCHOOL/r/RRRR} TaRRRRena IT Group. 2)替换全部子串 格式: SCHOOL/r/RRRRTaRRRRenaITGroup.2{var//old/new}
以前面的SCHOOL变量作为测试,先确认变量值:
[root@svr5 ~]# echo $SCHOOL
Tarena IT Group.
将字符串中的所有r都替换为RRRR:
[root@svr5 ~]# echo ${SCHOOL//r/RRRR}
TaRRRRena IT GRRRRoup.
3)应用示例,根据变量值重设主机名
用法分解,将当前主机名的域后缀替换为“localdomain”:
[root@svr5 ~]# echo $HOSTNAME //确认当前的主机名
svr5.tarena.com
[root@svr5 ~]# echo ${HOSTNAME/tarena.com/localdomain}
svr5.localdomain //替换后的字串
将当前主机名整个替换为“localhost.localdomain”:
[root@svr5 ~]# echo KaTeX parse error: Expected '}', got 'EOF' at end of input: {HOSTNAME/HOSTNAME/localhost.localdomain}
localhost.localdomain
假设要设置的新主机名保存在变量MYFQDN内,则重设操作如下所示:
[root@svr5 ~]# MYFQDN=“dbsvr.example.org” //新主机名变量
[root@svr5 ~]# hostname KaTeX parse error: Expected '}', got 'EOF' at end of input: {HOSTNAME/HOSTNAME/$MYFQDN} //重设操作
[root@svr5 ~]# hostname //确认修改后的主机名
dbsvr.example.org
如果希望恢复为原来的主机名,只要修改变量MYFQDN的值,然后再重新执行一遍替换操作即可:
[root@svr5 ~]# MYFQDN=“svr5.tarena.com” //定义要恢复的主机名
[root@svr5 ~]# hostname KaTeX parse error: Expected '}', got 'EOF' at end of input: {HOSTNAME/HOSTNAME/$MYFQDN} //重设主机名
[root@svr5 ~]# hostname //确认恢复结果
svr5.tarena.com
引入变量来保存主机名以后,可以使Shell脚本具有更广泛的适用性。
步骤三:字符串的匹配删除
以处理系统默认的邮箱路径为例,可直接使用环境变量MAIL:
[root@svr5 ~]# echo M A I L / v a r / s p o o l / m a i l / r o o t 1 ) 从 左 向 右 , 最 短 匹 配 删 除 格 式 : MAIL /var/spool/mail/root 1)从左向右,最短匹配删除 格式: MAIL/var/spool/mail/root1{变量名#关键词}
删除从左侧第1个字符到最近的关键词“oo”的部分,
作通配符理解:
[root@svr5 ~]# echo ${MAIL#oo}
l/mail/root
删除从左侧第1个字符到最近的关键词“/”的部分:
[root@svr5 ~]# echo KaTeX parse error: Expected '}', got '#' at position 6: {MAIL#̲*/} var/spool/m…{变量名##关键词}
删除从左侧第1个字符到最远的关键词“oo”的部分:
[root@svr5 ~]# echo $MAIL //确认变量MAIL的值
/var/spool/mail/root
[root@svr5 ~]# echo ${MAIL##oo}
t
删除从左侧第1个字符到最远的关键词“/”的部分:
[root@svr5 ~]# echo ${MAIL##
/}
root
操作 ${MAIL##
/} 的效果与使用basename命令提取基本名称的效果相同:
[root@svr5 ~]# basename M A I L r o o t 3 ) 从 右 向 左 , 最 短 匹 配 删 除 格 式 : MAIL root 3)从右向左,最短匹配删除 格式: MAILroot3{变量名%关键词
}
删除从右侧最后1个字符到往左最近的关键词“oo”的部分,* 做通配符理解:
[root@svr5 ~]# echo $MAIL //确认变量MAIL的值
[root@svr5 ~]# echo ${MAIL%oo*}
/var/spool/mail/r
删除从右侧最后1个字符到往左最近的关键词“/”的部分:
[root@svr5 ~]# echo ${MAIL%/}
/var/spool/mail
操作 ${MAIL%/
} 的效果与使用dirname命令提取目录名称的效果相同:
[root@svr5 ~]# dirname M A I L / v a r / s p o o l / m a i l 4 ) 从 右 向 左 , 最 长 匹 配 删 除 格 式 : MAIL /var/spool/mail 4)从右向左,最长匹配删除 格式: MAIL/var/spool/mail4{变量名%%关键词*}
删除从右侧最后1个字符到往左最远的关键词“oo”的部分:
[root@svr5 ~]# echo $MAIL //确认变量MAIL的值
/var/spool/mail/root
root@svr5 ~]# echo ${MAIL%%oo*}
/var/sp
删除从右侧最后1个字符到往左最远的关键词“/”的部分(删没了):
[root@svr5 ~]# echo ${MAIL%%/*}

[root@svr5 ~]#
步骤四:编写renfilex.sh脚本
1)验证原始改名脚本renfile.sh的效果
脚本用途为:批量修改当前目录下的文件扩展名,将.doc改为.txt。
脚本内容参考如下:
[root@svr5 ~]# vim renfile.sh
#!/bin/bash
for FILE in *.doc
do
mv $FILE ${FILE%.doc}.txt
done
[root@svr5 ~]# chmod +x renfile.sh
创建一个测试用的文件夹rendir,并在其下建几个测试文件
[root@svr5 ~]# mkdir rendir
[root@svr5 ~]# cd rendir
[root@svr5 rendir]# touch file1.doc abcde.doc xxyyzz.doc other1.xls killbill.mp4
[root@svr5 rendir]# ls
abcde.doc file1.doc killbill.mp4 other1.xls xxyyzz.doc
调用renfile.sh脚本,查看修改结果(原来扩展名为.doc的文件,其扩展名都变成了.txt):
[root@svr5 rendir]# …/renfile.sh
[root@svr5 rendir]# ls
abcde.txt file1.txt killbill.mp4 other1.xls xxyyzz.txt
2)建立改进版脚本renfilex.sh
要适应不同扩展名文件的修改,并能够反向还原。
修改前的扩展名、修改后的扩展名通过位置变量 $1、$2提供。
改进的脚本编写参考如下:
[root@svr5 rendir]# cp …/renfile.sh …/renfilex.sh
[root@svr5 rendir]# vim …/renfilex.sh
#!/bin/bash
for FILE in “$1”
do
mv $FILE ${FILE%$1}"$2"
done
3)验证、测试改进后的脚本
将 *.doc文件的扩展名改为.txt:
[root@svr5 rendir]# ls //修改前
abcde.txt file1.txt killbill.mp4 other1.xls xxyyzz.txt
[root@svr5 rendir]# …/renfilex.sh .txt .doc
[root@svr5 rendir]# ls //修改后
abcde.doc file1.doc killbill.mp4 other1.xls xxyyzz.doc
将 *.mp4文件的扩展名改为.mkv:
[root@svr5 rendir]# ls //修改前
abcde.doc file1.doc killbill.mp4 other1.xls xxyyzz.doc
[root@svr5 rendir]# …/renfilex.sh .mp4 .mkv
[root@svr5 rendir]# ls //修改后
abcde.doc file1.doc killbill.mkv other1.xls xxyyzz.doc

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值