2018.09.21更新于文章尾部:第二个函数优化了处理时间,占用更少内存和时间
2020.05.07更新于前两个函数:加入了说明注释,方便理解
2022.06.06更新一个比较巧妙的方法<GetStringSplit>
--------------------------------------------
因为之前被人问到这个问题,如果不使用别人已经做好的功能而自己写一个string分割函数该怎么做,于是我就做了一下,应该够用了。
结构:
需要被分割的字符串:std::string
分割之后的结果:typedef std::vector<std::string> StringList;
第一个函数:
根据指定字符来分割字符串
StringList splitstr(const std::string& str, char tag)
{
StringList li;
std::string subStr;
//遍历字符串,同时将i位置的字符放入到子串中,当遇到tag(需要切割的字符时)完成一次切割
//遍历结束之后即可得到切割后的字符串数组
for(size_t i = 0; i < str.length(); i++)
{
if(tag == str[i]) //完成一次切割
{
if(!subStr.empty())
{
li.push_back(subStr);
subStr.clear();
}
}
else //将i位置的字符放入子串
{
subStr.push_back(str[i]);
}
}
if(!subStr.empty()) //剩余的子串作为最后的子字符串
{
li.push_back(subStr);
}
return li;
}
第二个函数:
根据传入的一段字符串来分割字符串
StringList splitstr(const std::string& str, const std::string& pattern)
{
StringList li;
std::string subStr;
std::string tPattern;
size_t patternLen =pattern.length();
//遍历字符串,将i位置的字符放入子串中,当遇到pattern子串时完成一次切割
//遍历之后得到切割后的子串列表
for(size_t i = 0; i < str.length(); i++)
{
if(pattern[0] == str[i])//遇到需要检测pattern的情况
{
tPattern = str.substr(i, patternLen);
if(tPattern == pattern)//找到一个匹配的pattern,完成切割
{
i += patternLen - 1;
if(!subStr.empty())
{
li.push_back(subStr);
subStr.clear();
}
}
else//不是匹配的pattern,将i位置的字符放入子串
{
subStr.push_back(str[i]);
}
}
else//未遇到pattern,将i位置的字符放入子串
{
subStr.push_back(str[i]);
}
}
if(!subStr.empty())//将子串中的剩余字符放入子字符串队列
{
li.push_back(subStr);
}
return li;
}
让我们来看看结果,先定义一串字符串:
std::string text="this is a text row data!";
调用第一个函数:
StringList res = splitstr(text, ' ');
std::cout << "string list count:" << res.size() <<endl;
for(int i = 0; i < res.size(); i++)
{
std::cout << res[i] << endl;
}
结果:
调用第二个函数:
StringList res = splitstr(text, "is");
std::cout << "string list count:" << res.size() <<endl;
for(int i = 0; i < res.size(); i++)
{
std::cout << res[i] << endl;
}
结果:
----------------------------------------------------------
2018.09.21更新,优化了第二个函数的时间和空间:
StringList splitstr_v2(const std::string& str, const std::string& pattern)
{
StringList li;
std::string subStr;
std::string tPattern;
size_t patternLen =pattern.length();
size_t strLen = str.length();
for(size_t i = 0; i < str.length(); i++)
{
if(pattern[0] == str[i] && ((strLen - i) >= patternLen))
{
if(memcmp(&pattern[0],&str[i], patternLen) == 0)
{
i += patternLen - 1;
if(!subStr.empty())
{
li.push_back(subStr);
subStr.clear();
}
}
else
{
subStr.push_back(str[i]);
}
}
else
{
subStr.push_back(str[i]);
}
}
if(!subStr.empty())
{
li.push_back(subStr);
}
return li;
}
2022.06.06一个巧妙的方法:
void GetStringSplit(string str,const const char split)
{
istringstream iss(str); // 输入流
string token; // 接收缓冲区
while (getline(iss, token, split)) // 以split为分隔符
{
cout << token << endl; // 输出
}
}