C++常用字符串分割方法

From:http://www.jb51.net/article/55954.htm



1. 用strtok函数进行字符串分割


原型:       char *strtok(char *str, const char *delim);
功能:       分解字符串为一组字符串。
参数说明:str为要分解的字符串,delim为分隔符字符串。
返回值:    从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。
其它:       strtok函数线程不安全,可以使用strtok_r替代。

代码示例:

//借助strtok实现split
#include <string.h>
#include <stdio.h>

int main()
{
    char chArry[] = "one two   three,four * five";
    const char *d = " ,*";
    char *p;
    p = strtok(s,d);
    while(p != NULL)
    {
        printf("%s\n", p);
        p=strtok(NULL, d);
    }
    return 0;
}



2. 用STL进行字符串的分割


涉及到string类的两个函数find和substr:

1、find函数
        原型:       size_t find ( const string& str, size_t pos = 0 ) const;
        功能:       查找子字符串第一次出现的位置。
        参数说明:str为子字符串,pos为初始查找位置。
        返回值:    找到的话返回第一次出现的位置,否则返回string::npos
2、substr函数
        原型:       string substr ( size_t pos = 0, size_t n = npos ) const;
        功能:       获得子字符串。
        参数说明:pos为起始位置(默认为0),n为结束位置(默认为npos)
        返回值:    子字符串


示例代码:

#include <iostream>
#include <string>
#include <vector>

//字符串分割函数
std::vector<std::string> split(std::string str,std::string pattern)
{
    std::string::size_type pos;
    std::vector<std::string> result;
    
    str+=pattern;//扩展字符串以方便操作
    int size=str.size();
    
    for(int i=0; i<size; i++)
    {
        pos=str.find(pattern,i);
        if(pos<size)
        {
            std::string s=str.substr(i,pos-i);
            result.push_back(s);
            i=pos+pattern.size()-1;
        }
    }
    return result;
}

int main()
{
    std::string str;
    std::cout<<"Please input str:"<<std::endl;
    //std::cin>>str;
    getline(std::cin,str);
    std::string pattern;
    std::cout<<"Please input pattern:"<<std::endl;
    //std::cin>>pattern;
    getline(std::cin,pattern);//用于获取含空格的字符串
    std::vector<std::string> result=split(str,pattern);
    std::cout<<"The result:"<<std::endl;
    for(int i=0; i<result.size(); i++)
    {
        std::cout<<result[i]<<std::endl;
    }
    
    std::cin.get();
    std::cin.get();
    return 0;
}


find_first_not_of

#include<string>
#include<vector>
#include<iostream>
using namespace std;

void Tokenize(const string& str, vector<string>& tokens, const string& delimiters)
{
    // Skip delimiters at beginning.
    string::size_type lastPos = str.find_first_not_of(delimiters, 0);
    // Find first "non-delimiter".
    string::size_type pos = str.find_first_of(delimiters, lastPos);
    while (string::npos != pos || string::npos != lastPos)
    {
        // Found a token, add it to the vector.
        tokens.push_back(str.substr(lastPos, pos - lastPos));
        // Skip delimiters.  Note the "not_of"
        lastPos = str.find_first_not_of(delimiters, pos);
        // Find next "non-delimiter"
        pos = str.find_first_of(delimiters, lastPos);
    }
}
int main(int argc, char *argv[])
{
    string str("====aaa==bbb=ccc=ddd====");
    vector<string>tokens;
    Tokenize(str, tokens, "=");
    for( int i = 0; i < tokens.size() ; i++ )
    {
        cout << tokens[i] << endl;
    }
    return 0;
}



3. 用Boost进行字符串的分割


用boost库的正则表达式实现字符串分割

示例代码:

#include <iostream>
#include <cassert>
#include <vector>
#include <string>
#include "boost/regex.hpp"
 
std::vector<std::string> split(std::string str,std::string s)
{
    boost::regex reg(s.c_str());
    std::vector<std::string> vec;
    boost::sregex_token_iterator it(str.begin(),str.end(),reg,-1);
    boost::sregex_token_iterator end;
    while(it!=end)
    {
        vec.push_back(*it++);
    }
    return vec;
}
int main()
{
    std::string str,s;
    str="sss/ddd/ggg/hh";
    s="/";
    std::vector<std::string> vec=split(str,s);
    for(int i=0,size=vec.size();i<size;i++)
    {
        std::cout<<vec[i]<<std::endl;
    }
    std::cin.get();
    std::cin.get();
    return 0;
}


boost里面有自带的split的函数,如果用boost的话,还是直接用split的好

示例代码:

#include <iostream>
#include <string>
#include <vector>
#include <boost/algorithm/string/classification.hpp>
#include <boost/algorithm/string/split.hpp>

using namespace std;

int main()
{
    string s = "sss/ddd,ggg";
    vector<string> vStr;
    boost::split( vStr, s, boost::is_any_of( ",/" ), boost::token_compress_on );
    for( vector<string>::iterator it = vStr.begin(); it != vStr.end(); ++ it )
        cout << *it << endl;
    return 0;
}





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值