批处理字符串截取
在批处理中,set的功能有点繁杂:设置变量、显示环境变量的名及值、做算术运算、等待用户的输入、字符串截取、替换字符串,是我们常用的命令之一。
在字符串截取方面,新手因为没能注意到偏移量的问题,很容易提取到错误的字符串,因此,特开此帖,详细解释 set 截取字符的用法。
我们先来看一个例子:
set str=123456789
现在,我需要提取变量 str 中的第一个字符,那么,该怎么写命令呢?
set var=%str:~1,1%
?我想,这很可能是很多粗懂set用法的新手们的第一反应,实际上,这条语句提取到的是字符"2",并不是我们想要的"1",也就是说,set var=%str:~1,1% 提取到的是字符串第二位上的字符,而不是第一位上的,这是什么原因呢?
原来,set 命令从左到右做字符截取的时候,是以整个字符串的第一个字符为起点来计算要截取字符的偏移量的,也就是说,截取字符的时候,set 会计算提取后字符串的第一个字符相对于整个字符串第一个字符偏移了多少字符的长度。请注意,set 是按偏移量而不是字符的绝对位置来提取字符的,这一点非常重要。只要牢记这一点,大家在截取字符的时候,将会不再在这个问题上犯错。
现在,我们可以把截取字符的命令用一条语句模式来表示,那就是:set var=%str:~偏移量,长度%
。
我们来详细解读这条语句模式的含义:
首先,我们需要把要操作的字符串赋予一个变量,在这条语句中,是把字符串赋予了变量 str ;然后,我们需要确定一下我们想提取的字符串是哪一部分,比如说要提取字符串第2个字符及其之后的3个字符,或是提取字符串第5个字符及其之后的4个字符……,最后,计算偏移量及长度,比如要提取字符串第2个字符及其之后的3个字符,那么,也就是提取相对于第一个字符偏移量为1、提取后的字符串长度为4的字符串,写成语句就是:set var=%str:~1,4%
。
到目前为止,我们只谈到了很简单的截取操作,如果碰到比较复杂的提取需求,比如:提取第2个字符及其之后的所有字符、提取最后的3个字符、提取倒数第2个及其之前的3个字符、提取除了最后4个字符的字符串……那又该怎么办呢?别着急,set 命令在设计的时候就已经充分考虑到我们的复杂需求,只要对刚才我们提到的字符截取语句稍做改动,就可以很轻松地完成任务。
我们知道,数字的正负可以用±符号来表示,同样的,方向的正反也可以用±来标注。在 set 做字符截取的时候,引入了±符号来表示字符截取的方向:从左到右截取为+,从右到左截取为-,所以,set var=%str:~1,4% 也可以写成 set var=%str:~+1,+4% ,只是在从右到左截取的时候,情况发生了一点变化,那就是:偏移量的起点以整个字符串最后一个字符的后一位来计算。现在,我们可以来回答上一段中提出的一些问题:
提取最后的3个字符:set var=%str:~-3%
提取倒数第2个及其之前的3个字符:set var=%str:~-5,4%
提取除了最后4个字符的字符串:set var=%str:~0,-4%
看了上面三种需求的代码,大家可能又会产生新的疑问:第一条怎么只有一个数字啊?第三条最后一个数字是负号,又表示什么意思呢?
原来,在 set var=%str:~偏移量,长度%
这样的语句中,如果没有逗号及其之后的长度,就表示截取偏移量位置上及其之后的所有字符,如果长度的值为负数,则表示抛弃最后几个字符。
现在,我们可以对任意位置上的字符做提取工作了(假设 set str=123456789):
① 提取1: set var=%str:~0,1% 或 set var=%str:~0,-8% 或 set var=%str:~-9,1%
② 提取2: set var=%str:~1,1% 或 set var=%str:~1,-7% 或 set var=%str:~-8,1%
③ 提取9: set var=%str:~8,1% 或 set var=%str:~8% 或 set var=%str:~-1,1% 或 set var=%str:~-1%
④ 提取123:set var=%str:~0,3% 或 set var=%str:~0,-6% 或 set var=%str:~-9,3%
⑤ 提取234:set var=%str:~1,3% 或 set var=%str:~1,-5% 或 set var=%str:~-8,3%
⑥ 提取789:set var=%str:~6,3% 或 set var=%str:~6% 或 set var=%str:~-3,3% 或 set var=%str:~-3%
最后,我们来总结一下字符截取的规律:
1、截取字符串可以用 set var=%str:~数值1,数值2%
这样的语句来实现;
2、字符的截取是以偏移量来计算的,而不是以字符的绝对位置来计算;
3、当数值1为正数时,表示从左到右截取;当数值1为负数时,表示从右到左截取;
4、当数值2为正数时,表示要截取后字符串的长度;当为负数时,表示要抛弃的最后几个字符长度;
5、当数值2及其之前的逗号不存在时,表示截取的是第(数值1+1)个字符及其之后的所有字符;
案例1:从左往右截取,舍弃前4个字符
set var=123456789
echo %var:~4%
pause
-----------------------------
运行结果:
56789
案例2:从左往右截取,只要前3个字符
set var=123456789
echo %var:~0,3%
pause
-----------------------------
运行结果:
123
案例3:从右往左截取,截取3个字符
set var=123456789
echo %var:~0,-3%
pause
-----------------------------
运行结果:
123456
案例4:从左往右舍弃第1位,从右往左舍弃3位
set var=123456789
echo %var:~1,-3%
pause
-----------------------------
运行结果:
123456
- ~ 波浪号后面的数字:为正数表示舍弃变量的前位;
- , 逗号后面的数字为正数表示取变量的舍弃以后的前几位;
- , 逗号后面为负数表示舍弃变量的后几位