使用boost库拆分字符串

C/C++ 专栏收录该内容
109 篇文章 2 订阅

作者:朱金灿

来源:http://blog.csdn.net/clever101

 

          在日常开发中经常会遇到分割字符串的要求,boost库为我们提供了一个方便的分词器——boost::tokenizer。现在就让我们学习一下boost库的分词器。

#include <string>
#include <iostream>

#include <boost/format.hpp>
#include <boost/tokenizer.hpp>
#include <boost/algorithm/string.hpp>

int _tmain(int argc, _TCHAR* argv[])
{
    // 待分割的字符串
	std::string strTag = _T("I Come from China");
    // 定义分割方式为英文逗号,中文逗号和空格,构造一个分词器,
	boost::char_separator<char> sep(" ,,");
	typedef boost::tokenizer<boost::char_separator<char> >
		CustonTokenizer;
	CustonTokenizer tok(strTag,sep);

	// 输出分割结果
	std::vector<std::string> vecSegTag;
	for(CustonTokenizer::iterator beg=tok.begin(); beg!=tok.end();++beg)
	{
		vecSegTag.push_back(*beg);
	}

	for (size_t i  =0;i<vecSegTag.size();i++)
	{
		std::cout<<vecSegTag[i]<<std::endl;
	}

	// 尝试下分割中文字符
	vecSegTag.clear();
    std::string strTag2 = _T("我叫小明,你呢,今天天气不错");
	CustonTokenizer tok2(strTag2,sep);
	for(CustonTokenizer::iterator beg=tok2.begin(); beg!=tok2.end();++beg)
	{
		vecSegTag.push_back(*beg);
	}

	for (size_t i  =0;i<vecSegTag.size();i++)
	{
		std::cout<<vecSegTag[i]<<std::endl;
	}

	getchar();
	return 0;
}

        

         但是boost::tokenizer的一个缺点是它不支持分割unicode字符串。所以要分割unicode字符串我们需要使用boost库提供的另一个接口——boost::split。它的使用比boost::tokenizer还要方便,请看下面代码:

#include <string>
#include <iostream>

#include <boost/format.hpp>
#include <boost/tokenizer.hpp>
#include <boost/algorithm/string.hpp>

int _tmain(int argc, _TCHAR* argv[])
{
	std::wcout.imbue(std::locale("chs"));
    // 待分割的字符串
	std::wstring strTag = _T("I Come from China");

	std::vector<std::wstring> vecSegTag;
     // boost::is_any_of这里相当于分割规则了
	boost::split(vecSegTag, strTag,boost::is_any_of(_T(" ,,")));

	for (size_t i  =0;i<vecSegTag.size();i++)
	{
		std::wcout<<vecSegTag[i]<<std::endl;
	}

	vecSegTag.clear();
	std::wstring strTag2 = _T("我叫小明,你呢,今天天气不错");
	boost::split(vecSegTag, strTag2, boost::is_any_of(_T(" ,,")));

	for (size_t i  =0;i<vecSegTag.size();i++)
	{
		std::wcout<<vecSegTag[i]<<std::endl;
	}
	getchar();
	return 0;
}


      如果你觉得我的博客对你有帮助,请在下面网址中博客之星评选活动投我一票:

http://vote.blog.csdn.net/item/blogstar/clever101(单击候选人介绍下面的投他一票那个按钮)

参与投票有机会获奖:

     最佳贡献奖:通过微博分享活动就有机会获得30元充值卡一张(每周抽选5名)
    幸运奖:凡参与投票用户就有机会获得精美小礼品一份。(每周抽选5名)
    积极参与奖:所有参与投票并符合条件的用户均可获得20个下载积分。



  • 6
    点赞
  • 8
    评论
  • 1
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

©️2021 CSDN 皮肤主题: 猿与汪的秘密 设计师:白松林 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值