c++ 按分割符(忽略多次出现)切割string字符串

最近在做各家公司的笔试题,每次花在数据输入上时间很多,尤其是遇到字符串问题,总是卡壳。而其中最麻烦的就是输入一串字符串,以分隔符进行分隔,比如逗号,忽略出现多次的情况。因为C++不像python和Java有很好的库函数帮助我们,唯一可用的Boost库不能用,这也强迫我们使用自己定义的split函数了。所以,这篇文章也是自己的一个总结,希望自己以后可以查阅,也可以帮助其他需要的同学。

1. 问题描述

  1. 基础版本:给定一个字符串比如"aa,bb,cc,dd,ee" 让你取出其中的"aa" “bb” “cc” “dd” "ee"五个元素。
  2. 进阶版本: 给定一个字符串比如"aa, , , ,bb,cc, , ,dd, , , ,ee,“让你忽略其中逗号出现多次的情况,还是输出"aa” “bb” “cc” “dd” "ee"五个元素。

2. 解决思路

关于自定义字符串分割网上有几种方法

  1. 使用strtok函数
  2. 使用stringstream方法
  3. 使用boost::split方法

这里的话,因为第三种方法一般的OJ平台可能不能使用boost库了,这里也就不做介绍了,大家感兴趣可以去网上看看。

3. 自定义分隔字符串二种方法

一般情况下,我们想拿到一个字符串分隔的函数,就想直接可以用,所以这里的话,我们只把代码贴一下,具体的原理的话网上也是很多,也就不太详细介绍了。

3.1 使用strtok实现自定义split函数

函数说明:

  1. strs: 输入字符串,是你要分隔的字符串,比如"aa,bb,cc,dd"或者"aa, , bb, , ,ccc" 它是可以接受多个分隔符的,并自动忽略。
  2. delim: 是分隔符,比如逗号或者其他符号。多个情况也就使用一编就好了。接受参数是字符串。
  3. 返回值:一个vector,里面元素是string类型。
vector<string> split(const string& strs, const string& delim) {
	vector<string> res;
	if (strs == "") return res;
	char* str = new char[strs.size() + 1];
	strcpy(str, strs.c_str());
	char* d = new char[delim.size() + 1];
	strcpy(d, delim.c_str());
	char* p = strtok(str, d);
	while (p) {
		string temp = p;
		res.push_back(temp);
		p = strtok(NULL, d);
	}
	delete[]str;
	delete[]d;
	return res;
}
3.2 使用stringstream实现自定义split函数

函数说明:

  1. strs: 输入字符串,是你要分隔的字符串,比如"aa,bb,cc,dd"。这里注意一下:这种方法不能忽略分隔符出现多次的情况,也就是只能处理分隔符出现一次情况。
  2. delim: 是分隔符,比如逗号或者其他符号。只能是一个char类型,也就是接受一个字符。
  3. 返回值:一个vector,里面元素是string类型。
vector<string> split2(const string& strs,  const char& delim) {
	vector<string> res;
	if (strs == "") return res;
	stringstream sstr(strs);
	string token;
	while (getline(sstr, token, delim))
	{
		res.push_back(token);
	}

	return res;
}

4. 实验

4.1 处理单个分隔符的情况

比如处理:str1 = "aa,bb,cc,dd,ee"

#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
#include <vector>
#include <string>
#include <algorithm>
#include <sstream>
#include <stdlib.h>

using namespace std;

vector<string> split(const string& strs, const string& delim) {
	vector<string> res;
	if (strs == "") return res;
	char* str = new char[strs.size() + 1];
	strcpy(str, strs.c_str());
	char* d = new char[delim.size() + 1];
	strcpy(d, delim.c_str());
	char* p = strtok(str, d);
	while (p) {
		string temp = p;
		res.push_back(temp);
		p = strtok(NULL, d);
	}
	delete[]str;
	delete[]d;
	return res;
}

vector<string> split2(const string& strs,  const char& delim) {
	vector<string> res;
	if (strs == "") return res;
	stringstream sstr(strs);
	string token;
	while (getline(sstr, token, delim))
	{
		res.push_back(token);
	}

	return res;
}

int display(vector<string>& res) {
	int count = 0;
	for (auto it : res) {
		cout << it << " ";
		count++;
	}
	cout << endl;
	return count;
}

int main() {
	string strs1 = "aa,bb,cc,dd,ee";
	string strs2 = "aa,,,,bb,cc,,,dd,,,,ee,,";
	
	vector<string> res1 = split(strs1, ",");
	int count1 = display(res1);
	cout << count1 << endl;

	vector<string> res2 = split2(strs1, ',');
	int count2 = display(res2);
	cout << count2 << endl;

	system("pause");
	return 0;
}

在这里插入图片描述

4.2 处理分隔符出现多次的情况

比如处理:str2 = "aa,,,,bb,cc,,,dd,,,,ee,,"

#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
#include <vector>
#include <string>
#include <algorithm>
#include <sstream>
#include <stdlib.h>

using namespace std;

vector<string> split(const string& strs, const string& delim) {
	vector<string> res;
	if (strs == "") return res;
	char* str = new char[strs.size() + 1];
	strcpy(str, strs.c_str());
	char* d = new char[delim.size() + 1];
	strcpy(d, delim.c_str());
	char* p = strtok(str, d);
	while (p) {
		string temp = p;
		res.push_back(temp);
		p = strtok(NULL, d);
	}
	delete[]str;
	delete[]d;
	return res;
}

vector<string> split2(const string& strs,  const char& delim) {
	vector<string> res;
	if (strs == "") return res;
	stringstream sstr(strs);
	string token;
	while (getline(sstr, token, delim))
	{
		res.push_back(token);
	}

	return res;
}

int display(vector<string>& res) {
	int count = 0;
	for (auto it : res) {
		cout << it << " ";
		count++;
	}
	cout << endl;
	return count;
}

int main() {
	string strs1 = "aa,bb,cc,dd,ee";
	string strs2 = "aa,,,,bb,cc,,,dd,,,,ee,,";
	
	vector<string> res1 = split(strs2, ",");
	int count1 = display(res1);
	cout << count1 << endl;

	vector<string> res2 = split2(strs2, ',');
	int count2 = display(res2);
	cout << count2 << endl;

	system("pause");
	return 0;
}

在这里插入图片描述

5. 实验说明

  1. 从结果上看 使用strtok函数 和stringstream方法都可以很好的处理单个分隔符的情况。
  2. 但是存在分隔符重复出现的情况下,stringstream方法不能很好的处理,strtok仍然可以很好的处理。

6. 参考文章

  1. strtok()函数详解!
  2. C++ 字符串的分割函数split 及 用法
  3. c++如何分割带有逗号的字符串
  4. C++常用字符串分割方法
  5. C++分割字符串(以逗号分隔符为例,分割得到相应数字)
  6. C/C++ 使用delete删除指针需小心 “野指针”

上面的实现方法可能不是最优的,也会出现一些Bug,希望大家可以批评指正,一起学习。之前一直想要写总结,但是一直没写,现在终于写完了,也算是很Nice的。

  • 5
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值