【转载】SHELL字符串处理技巧(${}、##、%%)

转载自:http://www.cnblogs.com/pmars/archive/2013/02/17/2914444.html

在SHELL编程中,经常要处理一些字符串变量。比如,计算长度啊、截取子串啊、字符替换啊等等,常常要用到awk、expr、sed、tr等命令。下面给大家介绍个简单的字符串处理方法,用不着嵌套复杂的子命令。

${#VALUE}:计算VALUE字符串的字符数量。
${VALUE%.*}或${VALUE%%.*}:删除VALUE字符串中以分隔符“.”匹配的右边字符,保留左边字符。
${VALUE#*.}或${VALUE##*.}:删除VALUE字符串中以分隔符“.”匹配的左边字符,保留右边字符。
${VALUE/OLD/NEW}或${VALUE//OLD/NEW}:用NEW子串替换VALUE字符串中匹配的OLD子串。

补充:“*”表示通配符,用于匹配字符串将被删除的字串。“.”表示字符串中分隔符,可以为任意一个或 多个字符。“%”表示从右向左匹配,“#”表示从左向右匹配,“\”表示替换,都属于非贪婪匹配,即匹配符合通配符的最短结果。与“%”、“#”和“/” 类似的有“%%”、“##”和“//”,都属于贪婪匹配,即匹配符合通配符的最长结果。

${VALUE:OFFSET}或${VALUE:OFFSET:LENGTH}:从VALUE字符串的左边开始中截取子串。
${VALUE:0-OFFSET}或${VALUE:0-OFFSET:LENGTH}:从VALUE字符串的右边开始中截取子串。

补充:左边第一个字符从“0”开始,右边第一个字符从“0-1”开始。 表示偏移OFFSET个字符开始,LENGTH表示要截取字符的长度。如果没有LENGTH变量,表示偏移OFFSET个字符开始到字符串结束。

${VALUE:-WORD}:当变量未定义或者值为空时,返回值为WORD的内容,否则返回变量的值。
${VALUE:=WORD}:当变量未定义或者值为空时,返回WORD的值的同时并将WORD赋值给VALUE,否则返回变量的值。
${VALUE:+WORD}:当变量已赋值时,其值才用WORD替换,否则不进行任何替换。
${VALUE:?MESSAGE}:当变量已赋值时,正常替换。否则将消息MESSAGE送到标准错误输出(若此替换出现在SHELL程序中,那么该程序将终止运行)。

补充:WORD可以为一个字符串,也可以为一个变量。当为变量时,需要用“$”引用该变量。

参考:http://blog.zol.com.cn/2322/article_2321763.html

( ) 与 ‘ ‘ ( 反引号 ) 在 b a s h s h e l l 中, ( ) 与 ` ` (反引号) 在 bash shell 中, ()‘‘(反引号)bashshell中,( ) 与 (反引号) 都是用来做命令替换用(command substitution)的。

所谓的命令替换与我们第五章学过的变量替换差不多,都是用来重组命令行:

  • 完成引号里的命令行,然后将其结果替换出来,再重组命令行。
    例如:
    [code]echothelastsundayis

(date -d “last sunday” +%Y-%m-%d)[/code]
如此便可方便得到上一星期天的日期了… _

用 $( ) 的理由:

1, 很容易与 ’ ’ ( 单引号)搞混乱,尤其对初学者来说。
有时在一些奇怪的字形显示中,两种符号是一模一样的(直竖两点)。
当然了,有经验的朋友还是一眼就能分辩两者。只是,若能更好的避免混乱,又何乐不为呢? _

2, 在多层次的复合替换中, 须要额外的跳脱( ` )处理,而 $( ) 则比较直观。例如:
这是错的:
[code]command1 command2 command3 [/code]
原本的意图是要在 command2 command3 先将 command3 提换出来给 command 2 处理,
然后再将结果传给 command1 command2 … 来处理。
然而,真正的结果在命令行中却是分成了 command2 与 “ 两段。
正确的输入应该如下:
[code]command1 command2 \command3` `[/code]

要不然,换成 $( ) 就没问题了:
[code]command1 (command2

(command3))[/code]
只要你喜欢,做多少层的替换都没问题啦~~~ _

$( ) 的不足:

  1. 基本上可用在全部的 unix shell 中使用,若写成 shell cript: ,其移植性比较高。
    而 $( ) 并不见的每一种 shell 都能使用,我只能跟你说,若你用 bash2 的话,肯定没问题… _

${ } 用来作变量替换。
一般情况下,var与
{var} 并没有啥不一样。
但是用 ${ } 会比较精确的界定变量名称的范围,比方说:
$ A=B
echoAB
原本是打算先将 $A 的结果替换出来,然后再补一个 B 字母于其后,
但在命令行上,真正的结果却是只会提换变量名称为 AB 的值出来…
若使用 ${ } 就没问题了:
echo

{A}B
BB

不过,假如你只看到 ${ } 只能用来界定变量名称的话,那你就实在太小看 bash 了﹗
有兴趣的话,你可先参考一下 cu 本版的精华文章:
http://www.chinaunix.net/forum/viewtopic.php?t=201843

为了完整起见,我这里再用一些例子加以说明 ${ } 的一些特异功能:
假设我们定义了一个变量为:
file=/dir1/dir2/dir3/my.file.txt
我们可以用 ${ } 分别替换获得不同的值:
${file#/}:拿掉第一条 / 及其左边的字符串:dir1/dir2/dir3/my.file.txt
${file##
/}:拿掉最后一条 / 及其左边的字符串:my.file.txt
${file#.}:拿掉第一个 . 及其左边的字符串:file.txt
${file##
.}:拿掉最后一个 . 及其左边的字符串:txt
${file%/}:拿掉最后条 / 及其右边的字符串:/dir1/dir2/dir3
${file%%/
}:拿掉第一条 / 及其右边的字符串:(空值)
${file%.}:拿掉最后一个 . 及其右边的字符串:/dir1/dir2/dir3/my.file
${file%%.
}:拿掉第一个 . 及其右边的字符串:/dir1/dir2/dir3/my
记忆的方法为:
[list]# 是去掉左边(在鉴盘上 # 在 $ 之左边)
% 是去掉右边(在鉴盘上 % 在 $ 之右边)
单一符号是最小匹配﹔两个符号是最大匹配。[/list]
${file:0:5}:提取最左边的 5 个字节:/dir1
${file:5:5}:提取第 5 个字节右边的连续 5 个字节:/dir2

我们也可以对变量值里的字符串作替换:
${file/dir/path}:将第一个 dir 提换为 path:/path1/dir2/dir3/my.file.txt
${file//dir/path}:将全部 dir 提换为 path:/path1/path2/path3/my.file.txt

利用 ${ } 还可针对不同的变量状态赋值(没设定、空值、非空值):
file−my.file.txt:假如
file 没有设定,则使用 my.file.txt 作传回值。(空值及非空值时不作处理)
file:−my.file.txt:假如file 没有设定或为空值,则使用 my.file.txt 作传回值。 (非空值时不作处理)
file+my.file.txt:假如file 设为空值或非空值,均使用 my.file.txt 作传回值。(没设定时不作处理)
file:+my.file.txt:若file 为非空值,则使用 my.file.txt 作传回值。 (没设定及空值时不作处理)
file=my.file.txt:若file 没设定,则使用 my.file.txt 作传回值,同时将 $file 赋值为 my.file.txt 。 (空值及非空值时不作处理)
file:=my.file.txt:若file 没设定或为空值,则使用 my.file.txt 作传回值,同时将 $file 赋值为 my.file.txt 。 (非空值时不作处理)
file?my.file.txt:若file 没设定,则将 my.file.txt 输出至 STDERR。 (空值及非空值时不作处理)
file:?my.file.txt:若

file 没设定或为空值,则将 my.file.txt 输出至 STDERR。 (非空值时不作处理)

tips:
以上的理解在于, 你一定要分清楚 unset 与 null 及 non-null 这三种赋值状态.
一般而言, : 与 null 有关, 若不带 : 的话, null 不受影响, 若带 : 则连 null 也受影响.

还有哦,${#var} 可计算出变量值的长度:
${#file} 可得到 27 ,因为 /dir1/dir2/dir3/my.file.txt 刚好是 27 个字节…

接下来,再为大家介稍一下 bash 的组数(array)处理方法。
一般而言,A=“a b c def” 这样的变量只是将 $A 替换为一个单一的字符串,
但是改为 A=(a b c def) ,则是将 $A 定义为组数…
bash 的组数替换方法可参考如下方法:
A[@]或
{A[]} 可得到 a b c def (全部组数)
A[0]可得到a(第一个组数),{A[1]} 则为第二个组数…
{#A[@]} 或{#A[
]} 可得到 4 (全部组数数量)
{#A[0]} 可得到 1 (即第一个组数(a)的长度),

{#A[3]} 可得到 3 (第四个组数(def)的长度)
A[3]=xyz 则是将第四个组数重新定义为 xyz …

好了,最后为大家介绍 ( ( ) ) 的用途吧:它是用来作整数运算的。在 b a s h 中, (( )) 的用途吧:它是用来作整数运算的。 在 bash 中, (())的用途吧:它是用来作整数运算的。在bash中,(( )) 的整数运算符号大致有这些:

      • / :分别为 “加、减、乘、除”。
        % :余数运算
        & | ^ !:分别为 “AND、OR、XOR、NOT” 运算。

例:
$ a=5; b=7; c=2
echo
(( a+b*c ))
19
echo(( (a+b)/c ))
6
echo

(( (a*b)%c))
1

在 (())中的变量名称,可于其前面加
符号来替换,也可以不用,如:
((a + b∗

c)) 也可得到 19 的结果

此外,$(( )) 还可作不同进位(如二进制、八进位、十六进制)作运算呢,只是,输出结果皆为十进制而已:
echo $((16#2a)) 结果为 42 (16进位转十进制)
以一个实用的例子来看看吧:
假如当前的 umask 是 022 ,那么新建文件的权限即为:
$ umask 022
echo"obase=8;

(( 8#666 & (8#777 ^ 8#$(umask)) ))" | bc
644

事实上,单纯用 (( )) 也可重定义变量值,或作 testing:
a=5; ((a++)) 可将 $a 重定义为 6
a=5; ((a–)) 则为 a=4
a=5; b=7; ((a < b)) 会得到 0 (true) 的返回值。
常见的用于 (( )) 的测试符号有如下这些:
<:小于

:大于
<=:小于或等于
=:大于或等于
==:等于
!=:不等于

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值