C语言字符串分割——strtok

        之前遇到字符串分割的需求时,都是自己去实现,最近发现其实c标准库已经提供了这个功能。对标准库还是不熟悉啊,导致重复造车轮了,有必要把标准库看一下。。。

        先看一下之前自己实现的字符串分割函数:

void strsplit(const char *str, char *delim, void (*visitor)(const char *, int, int)){
        int i, k_s, k_e, s_len, d_len;
        s_len = strlen(str);
        d_len = strlen(delim);

        assert(str!=NULL && delim!=NULL && visitor!=NULL);
                                          
        k_s = k_e = 0;                    
        while(k_e < s_len){
                if( (k_e + d_len <= s_len) && strncmp(str+k_e, delim, d_len) == 0 ){
                        if(k_e > k_s)
                                visitor(str, k_s, k_e);
                        k_s = k_e = k_e + d_len;
                }else{
                        k_e++;
                }
        }

        if(k_e > k_s){
                visitor(str, k_s, k_e);
        }
}

        str:要分割的字符串的字符串。

        delim:分隔符,可以是多个字符的字符串。

        visitor:函数指针,在识别出子串时调用。
        对于字符串"abc##123###a##",分隔符是"##",会将其分割为"abc","123",“#a”。也就是说,要分割的字符串中的子串必须与分割字符串相等,才算做分隔符,而不是只要包含在分割字符串就算做分隔符,这个与标准库的有点不同。但是对于分隔符只有一个字符的情况与标准库的执行结果是相同的,比如:如果上面的字符串的分割符是"#",那么最后结果就是"abc",“123”,"a"。

        出现这个不一致,是因为如果某个子串与分割字符串相等,那么直接跳过strlen(分割字符串)个字符,然后继续检查。如果这里改成跳到下一个字符然后继续检查,那么就会和标准库的函数得到一样的结果。就是把第13行替换为:

k_e++;
k_s = k_e + (d_len - 1);
        上面介绍了分割字符串的实现,下面看一下标准库提供的函数strtok。

char *strtok(char *str, const char *delim);
        str:要分割的字符串。

        delim:分割字符串,包含在分割字符串中的字符都会被当做是分割字符而丢弃掉。

        看个例子:

#include <string.h>
#include <stdio.h>
#include <stdlib.h>

int
main(int argc, char **argv){
        char *s, *d, *t; 

        if(argc < 3){ 
                printf("%s\n", "wrong args. usage: str delim");
                exit(1);
        }   

        s = argv[1];
        d = argv[2];

        t = strtok(s, d);
        while(t != NULL){
                printf("%s\n", t);
                t = strtok(NULL, d);
        }          
}                  
        第一次调用strtok需要传入要分割的字符串str进行初始化,随后对同一个字符串继续分割传入NULL即可。这个地方需要注意,如果不传入NULL,那么就会出现死循环,一直返回str第一个被分割出的子串。

        分割字符串delim每次都可以传入不同的字符串,也就是说可以根据不同的分隔符分割字符串,不过这样的需求还是比较不常用的。

        通过这个函数以后完成配置文件的解析就比较方便了,不用再被各种各样的bug打扰。



### C语言中的字符串分割方法 在C语言中,可以通过标准库函数`strtok()`来实现字符串分割操作。该函数位于头文件`<string.h>`中[^2]。 #### 使用 `strtok()` 函数进行字符串分割 以下是使用`strtok()`函数的一个典型示例: ```c #include <stdio.h> #include <string.h> int main(void) { char src[100] = "www.baidu.com"; printf("原始字符串: %s\n", src); // 第一次调用时传递要分割字符串 char *token = strtok(src, "."); while (token != NULL) { printf("分割结果: %s\n", token); // 后续调用传入NULL即可继续分割 token = strtok(NULL, "."); } return 0; } ``` 上述代码展示了如何通过`.`字符作为分隔符将字符串`"www.baidu.com"`分割为多个部分。需要注意的是,在首次调用`strtok()`时需提供待分割字符串;而在后续调用中,则应将第一个参数设为`NULL`[^4]。 #### 注意事项 - **原字符串会被修改**:由于`strtok()`会在找到的分隔符位置将其替换为`\0`,因此它会改变输入字符串的内容。如果需要保留原始数据,应在分割之前复制一份副本。 - **线程安全性问题**:`strtok()`不是线程安全的,因为它内部维护了一个静态变量用于存储状态信息。对于多线程环境下的应用,建议改用其线程安全版本——`strtok_r()`。 #### 自定义字符串分割功能 除了利用现成的库函数外,还可以编写自定义逻辑完成更复杂的字符串解析需求。例如下面这个简单的例子实现了基于指定模式匹配的字符串切片工具: ```cpp #include <vector> #include <string> using namespace std; // 定义一个辅助函数用来按给定pattern切割字符串 vector<string> split(const string& str, const string& pattern){ vector<string> result; if("" == str || "" == pattern) return result; size_t pos=0; size_t index=str.find(pattern,pos); while(index!=string::npos){ result.push_back(str.substr(pos,index-pos)); pos=index+pattern.size(); index=str.find(pattern,pos); } if(pos<=str.length()){ result.push_back(str.substr(pos,str.length()-pos)); } return result; } int main(){ string s="hello world this is a test."; string p=" "; vector<string> v=split(s,p); for(auto it=v.begin();it!=v.end();++it){ cout<<(*it)<<endl; } return 0; } ``` 此程序采用STL容器类`std::vector<std::string>`保存每一段子串的结果,并支持任意长度的分隔符序列[^5]。
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值