目录
一、strtok()函数概述
strtok() 函数是一个用来分割字符串的非常有用的工具。下面我们详细讲解strtok() 函数的工作原理和使用。
二、strtok()函数定义
strtok() 函数用于将字符串分割成一系列的令牌(tokens)。这个函数声明在 <string.h> 头文件中,其原型如下:分解字符串为一组字符串。s为要分解的字符,delim为分隔符字符(如果传入字符串,则传入的字符串中每个字符均为分割符)。首次调用时,s指向要分解的字符串,之后再次调用要把s设成NULL。
在头文件#include中。
2.1.原型
char *strtok(char s[], const char *delim);
2.2.说明
(1)当strtok()在参数s的字符串中发现参数delim中包含的分割字符时,则会将该字符改为\0 字符。在第一次调用时,strtok()必需给予参数s字符串,往后的调用则将参数s设置成NULL。每次调用成功则返回指向被分割出片段的指针。
(2)返回值
从s开头开始的一个个被分割的串。当s中的字符查找到末尾时,返回NULL。如果查找不到delim中的字符时,返回当前strtok的字符串的指针。所有delim中包含的字符都会被滤掉,并将被滤掉的地方设为一处分割的节点。
(3)需要注意的是,使用该函数进行字符串分割时,会破坏被分解字符串的完整,调用前和调用后的s已经不一样了。第一次分割之后,原字符串str是分割完成之后的第一个字符串,剩余的字符串存储在一个静态变量中,因此多线程同时访问该静态变量时,则会出现错误。
2.3.参数说明
str:要分割的原始字符串。第一次调用 strtok() 时,str 应指向要分割的字符串;在随后的调用中,为了获取更多的令牌,str 应该设置为 NULL。
delim:包含分隔符字符的字符串。这些字符作为令牌的分隔符。
返回值:
返回指向下一个令牌的指针。
如果没有剩余的令牌,则返回 NULL。
三.strtok函数使用
3.1、 strtok函数
strtok函数会破坏被分解字符串的完整,调用前和调用后的s已经不一样了。如果要保持原字符串的完整,可以使用strchr和sscanf的组合等。
#include
#include
int main(void)
{
char input[16]="abc,d";
char*p;
/*strtok places a NULL terminator
infront of the token,if found*/
p=strtok(input,",");
if(p)
printf("%s\n",p);
/*Asecond call to strtok using a NULL
as the first parameter returns a pointer
to the character following the token*/
p=strtok(NULL,",");
if(p)
printf("%s\n",p);
return 0;
}
3.2、strtok_s函数
strtok_s是windows下的一个分割字符串安全函数,其函数原型如下:
char *strtok_s( char *strToken, const char *strDelimit, char **buf);
这个函数将剩余的字符串存储在buf变量中,而不是静态变量中,从而保证了安全性。
3.3、strtok_r函数
strtok_s函数是linux下分割字符串的安全函数,函数声明如下:
char *strtok_r(char *str, const char *delim, char **saveptr);
该函数也会破坏带分解字符串的完整性,但是其将剩余的字符串保存在saveptr变量中,保证了安全性。
例子:
#include
#include
#include
int main()
{
char str[]="ab,cd,ef";
char *ptr;
char *p;
printf("before strtok: str=%s\n",str);
printf("begin:\n");
ptr = strtok_r(str, ",", &p);
while(ptr != NULL){
printf("str=%s\n",str);
printf("ptr=%s\n",ptr);
ptr = strtok_r(NULL, ",", &p);
}
return 0;
}
输入结果:
before strtok: str=ab,cd,ef begin: str=ab ptr=ab str=ab ptr=cd str=ab ptr=ef
要使用strtok函数需要包含头文件string.h
#include
strtok函数的作用是把字符串以规定的字符分割开:
p = strtok(buf, "$");
p为指针,buf也是指针,这句代码的意思就是把buf中的字符串以"$"为分隔符分割开来,分割出来的字符串保存到指针p中。
再次调用strtok函数时,把buf换成NULL,不需要再写buf。即:
p = strtok(NULL, "$");
需要注意的是,strtok函数会把分割前的字符串破坏掉,即每次分割后,原来的字符串就会少掉一部分,完整性会被破坏。
p = strtok(buf, "$");
while( p!=NULL )
{
p = strtok(NULL, "$");
if( p==NULL )
{
break;
}
}
while循环离有一个判断p是否等于NULL的语句是因为strtok函数分割到最后没东西分的时候会返回一个空指针,所以需要加个判断跳出循环,否则就会出现段错误。这里也让我知道了,对于指针的使用前面必须加判断,判断是否为空指针,如为空指针需要报错,否则出现段错误都不知道是哪里出错。strtok函数的分隔字符还可以是多个,不一定只为一个
p = strtok(buf, "$,");
这句代码的意思是以"$"和","为分隔符分割buf中的字符串。每当遇到这两个字符其中一个都会分割,不是遇到"$,"两个字符连在一起才分割,记住只需要遇到其中一个字符就可以了,这样对于函数的使用人性化很多。
使用strtok()
分割以逗号和空格为分隔符的字符串代码示例:
// testStrtok.cpp : 此文件包含 "main" 函数。程序执行将在此处开始并结束。
//
#include <iostream>
#include <stdio.h>
#include <string.h>
int main() {
char str[] = "test, Strtok! start to programming!";
const char* delim = " ,!.";
char* token = strtok(str, delim);
while (token != NULL) {
printf("%s\n", token);
token = strtok(NULL, delim);
}
return 0;
}
输出结果:
四、注意事项
4.1、使用注意
strtok() 是非线程安全的,因为它使用了静态数据结构来存储数据。在多线程环境下,建议使用 strtok_r(),它是一个线程安全的版本。
使用 strtok() 会修改原始字符串,因为它在找到分隔符的地方插入了 \0。如果你需要保留原始字符串,考虑先复制一份原始数据。
4.2、替代方案
如果你的应用需要更灵活或安全的字符串分割方法,可以考虑以下替代方案:
strtok_r():线程安全版本的 strtok()。
strsep():另一个用于分割字符串的函数,它不会跳过空的令牌,而 strtok() 会。
使用其他编程语言或库,如C++中的 std::istringstream 或 Python中的 split() 方法。
五、总结
strtok() 是一个强大的工具,用于在C/C++语言中分割字符串,它非常有用,但需要小心使用,以避免安全问题和数据完整性问题。我们需要理解其内部机制和限制,从而可以更安全、有效地使用这个函数,好了,本篇到此为止,希望对大家有所帮助。