字符串分割(C++)

经常碰到字符串分割的问题,这里总结下,也方便我以后使用。

一、用strtok函数进行字符串分割

原型: char *strtok(char *str, const char *delim);

功能:分解字符串为一组字符串。

参数说明:str为要分解的字符串,delim为分隔符字符串。

返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。

其它:strtok函数线程不安全,可以使用strtok_r替代。

示例:

 1 //借助strtok实现split
 2 #include <string.h>
 3 #include <stdio.h>
 4 
 5 int main()
 6 {
 7         char s[] = "Golden Global      View,disk * desk";
 8         const char *d = " ,*";
 9         char *p;
10         p = strtok(s,d);
11         while(p)
12         {
13                 printf("%s\n",p);
14                 p=strtok(NULL,d);
15         }
16 
17         return 0;
18 }

为了帮助您更好地入门并深入掌握C++,我们精心准备了一系列丰富的学习资源包,包括但不限于基础语法教程、实战项目案例、核心概念解析以及进阶技巧指导等。

您只扫码上方二维码,即可免费获取这份专属的学习礼包。我们的教程覆盖了C++语言的各个方面,旨在让您在理论学习与实践操作中不断进步,提升编程技能。

同时,我们也鼓励您在学习过程中遇到任何问题时积极提问,我们会尽全力提供解答和帮助。期待您在C++编程的道路上越走越远,早日成为一位优秀的C++开发

 

 运行效果: 

二、用STL进行字符串的分割 

涉及到string类的两个函数find和substr:
1、find函数
原型:size_t find ( const string& str, size_t pos = 0 ) const;
功能:查找子字符串第一次出现的位置。
参数说明:str为子字符串,pos为初始查找位置。
返回值:找到的话返回第一次出现的位置,否则返回string::npos 

2、substr函数
原型:string substr ( size_t pos = 0, size_t n = npos ) const;
功能:获得子字符串。
参数说明:pos为起始位置(默认为0),n为结束位置(默认为npos)
返回值:子字符串 

实现如下:

 1 //字符串分割函数
 2 std::vector<std::string> split(std::string str,std::string pattern)
 3 {
 4     std::string::size_type pos;
 5     std::vector<std::string> result;
 6     str+=pattern;//扩展字符串以方便操作
 7     int size=str.size();
 8 
 9     for(int i=0; i<size; i++)
10     {
11         pos=str.find(pattern,i);
12         if(pos<size)
13         {
14             std::string s=str.substr(i,pos-i);
15             result.push_back(s);
16             i=pos+pattern.size()-1;
17         }
18     }
19     return result;
20 }

 完整代码:

 1 /*
 2         File      : split1.cpp
 3         Author    : Mike
 4         E-Mail    : Mike_Zhang@live.com
 5  */
 6 #include <iostream>
 7 #include <string>
 8 #include <vector>
 9 
10 //字符串分割函数
11 std::vector<std::string> split(std::string str,std::string pattern)
12 {
13     std::string::size_type pos;
14     std::vector<std::string> result;
15     str+=pattern;//扩展字符串以方便操作
16     int size=str.size();
17 
18     for(int i=0; i<size; i++)
19     {
20         pos=str.find(pattern,i);
21         if(pos<size)
22         {
23             std::string s=str.substr(i,pos-i);
24             result.push_back(s);
25             i=pos+pattern.size()-1;
26         }
27     }
28     return result;
29 }
30 
31 int main()
32 {
33     std::string str;
34     std::cout<<"Please input str:"<<std::endl;
35     //std::cin>>str;
36     getline(std::cin,str);
37     std::string pattern;
38     std::cout<<"Please input pattern:"<<std::endl;
39     //std::cin>>pattern;
40     getline(std::cin,pattern);//用于获取含空格的字符串
41     std::vector<std::string> result=split(str,pattern);
42     std::cout<<"The result:"<<std::endl;
43     for(int i=0; i<result.size(); i++)
44     {
45         std::cout<<result[i]<<std::endl;
46     }
47 
48     std::cin.get();
49     std::cin.get();
50     return 0;
51 }

运行效果:

三、用Boost进行字符串的分割

用boost库的正则表达式实现字符串分割
实现如下:

 1 std::vector<std::string> split(std::string str,std::string s)
 2 {
 3         boost::regex reg(s.c_str());
 4         std::vector<std::string> vec;
 5         boost::sregex_token_iterator it(str.begin(),str.end(),reg,-1);
 6         boost::sregex_token_iterator end;
 7         while(it!=end)
 8         {
 9                 vec.push_back(*it++);
10         }
11         return vec;
12 }

完整代码:

 1 //本程序实现的是利用正则表达式对字符串实现分割
 2 //运行环境      VC6.0 + boost 库
 3 /*
 4        File      : split2.cpp
 5        Author    : Mike
 6        E-Mail    : Mike_Zhang@live.com
 7 */
 8 #include <iostream>
 9 #include <cassert>
10 #include <vector>
11 #include <string>
12 #include "boost/regex.hpp"
13 
14 std::vector<std::string> split(std::string str,std::string s)
15 {
16         boost::regex reg(s.c_str());
17         std::vector<std::string> vec;
18         boost::sregex_token_iterator it(str.begin(),str.end(),reg,-1);
19         boost::sregex_token_iterator end;
20         while(it!=end)
21         {
22                 vec.push_back(*it++);
23         }
24         return vec;
25 }
26 int main()
27 {
28         std::string str,s;
29         str="sss/ddd/ggg/hh";
30         s="/";
31         std::vector<std::string> vec=split(str,s);
32         for(int i=0,size=vec.size();i<size;i++)
33         {
34                 std::cout<<vec[i]<<std::endl;
35         }
36         std::cin.get();
37         std::cin.get();
38         return 0;
39 }

运行效果:

补充:

最近发现boost里面有自带的split的函数,如果用boost的话,还是直接用split的好,这里就不多说了,代码如下:

#include <iostream>
#include <string>
#include <vector>
#include <boost/algorithm/string/classification.hpp>
#include <boost/algorithm/string/split.hpp>
 
using namespace std;
 
int main()
{
  string s = "sss/ddd,ggg";
  vector<string> vStr;
  boost::split( vStr, s, boost::is_any_of( ",/" ), boost::token_compress_on );
  for( vector<string>::iterator it = vStr.begin(); it != vStr.end(); ++ it )
    cout << *it << endl;
  return 0;
}

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
<> 一些背景知识: 1. 一个汉字在c\c++的存储, 使用2个字节(char)存储; 2. 汉字存储的第一个char, 其值一定大于'~'(0111 1110=126),否则将导致识别歧义; 此处, 使用"单ASCII字符"来表示非 单ASCII字符的判断, 可以根据以下规则(主要R3, R4); : 一个字符串的长度==1,那肯定是一个ASCII字符; : 一个字符串的长度==2,且第1个ASCII字符的编码小于'~'; 那肯定是2个单ASCII字符; -- (PS: "") : 一个字符串的长度==3,且中间的ASCII字符的编码小于'~'; 那第3个肯定是单ASCII字符; (前2个是否构成1个汉字不能确定) : (基于R3)如果第pos个位置的ASCII字符编码小于'~', 那从下标pos,pos+1处拆分字符串 (下标pos归前串),将不会导致乱码; A 或者 B 的选择,需要知道以下信息: (1). 从 cut_base_pos 开始到 pos_B 结束的这段字符串内, 最后一个单ASCII字符的结束下标 p 在此基础上, 若使用: y -- 表示单ASCII字符(已确定的); x -- 表示可能是 单ASCII字符,也可能是 汉字的半个ASCII存储码; 那么一段长度为N的字符串,按照存储的ASCII码可以表示为一串如下的字符串(不包含[]) "x .. x][x .. x y x .. x][x .. x", 其中 s,e表示当前正在分析的一段子串(0<=s<e<=N, 下标e-s = 期望的分割长度cut_size) ^ ^ ^ ^ ^ 0 s p e N 在 【s, e】 之间, 查找结束下标p 的思路: 从e开始向s查找, 找到 第一个y 后 break; 记录下标p, 则从位置p开始, 是一个正确的分割(cut); 但此分割并不是一个最好的分割. 可以在 位置p上, 再加上 2K 个长度, 使 p+2K 与 pos_B 最接近即可. 可以认为从2K个长度的内容是K个汉字(实际上并不一定..), 但并不影响这个最佳分割的正确性! :)

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值