背景
遇到一个将字符串分割场景.以前从没有用c语言实现,都是使用python的split()函数,python处理起来很简单.
split()方法语法:
str.split(str="", num=string.count(str)).
• str -- 分隔符,默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等。
• num -- 分割次数。
返回分割后的字符串列表。
用例:
#!/usr/bin/python
str = "Line1-abcdef \nLine2-abc \nLine4-abcd";
print str.split( );
print str.split(' ', 1 );
以上实例输出结果如下:
['Line1-abcdef', 'Line2-abc', 'Line4-abcd']
['Line1-abcdef', '\nLine2-abc \nLine4-abcd']
Python split()通过指定分隔符对字符串进行切片,如果参数num 有指定值,则仅分隔 num 个子字符串
C语言扩展
那使用C语言如何实现?
网上搜索到有个strtok函数具有分割字符串功能,信息如下
# man strtok
char *strtok(char *str, const char *delim);
The strtok() function breaks a string into a sequence of zero or more nonempty tokens. On the first call to strtok() the
string to be parsed should be specified in str. In each subsequent call that should parse the same string, str must be NULL.
C语言实现python中的split函数:
#include
#include
// 将str字符以spl分割,存于dst中,并返回子字符串数量
int split(char dst[][80], char* str, const char* spl)
{
int n = 0;
char *result = NULL;
result = strtok(str, spl);
while( result != NULL )
{
strcpy(dst[n++], result);
result = strtok(NULL, spl);
}
return n;
}
int main()
{
char str[] = "what is your name?";
char dst[10][80];
int cnt = split(dst, str, " ");
for (int i = 0; i < cnt; i++)
puts(dst[i]);
return 0;
}
开始时strtok第一次调用str传入需分割的字符串,返回第一段分割出来的字符串”what”的地址(以’\0’结尾),后续调用str为NULL,依次返回后续分割
字符串”is””your””name?”的地址.
到这里感觉有点奇怪,为什么后续str为NULL还能继续对”what is your name?”进行分割,它与第一次调用的关联在哪里?
strtok源码分析
下载c语言标准库源码:
git clone git://sourceware.org/git/glibc.git
cd glibc
git checkout --track -b local_glibc-2.26 origin/release/2.26/master
Strtok.c:
char * strtok (char *s, const char *delim)
{
static cha