[ C++ ] string类常见接口及其模拟实现

上一篇博文内容:string类的构造,拷贝,赋值拷贝,及其模拟实现[ C++ ] string类之构造,拷贝,赋值 及其模拟实现

本篇内容:string类的常见接口及其模拟实现,我将会从遍历5个方面对常见,常用的接口进行模拟实现string类。

该思维导图是本篇博文主要内容

目录

1、遍历

1.1 下标+operator [ ]

1.2 c_str

1.3 迭代器

1.4 范围for

2、增

2.1.push_back

2.2. 重载 += (char ch)

 2.3. append

2.4.重载 += (char*  str)

2.5. insert (任意位置插入)

2.5.1 任意位置插入一个字符

2.5.2 任意位置插入一个字符串

3.删

3.1 earse

4.查

4.1 查找一个字符

4.2 查找一个字符串

4.3 字符串比较

5.改

5.1 reserve

5.2 resize 


1、遍历

1.1 下标+operator [ ]

这种方法是最好理解的,我们使用下标将字符串的内容逐字符输出。

char& operator[](size_t pos)
{
	assert(pos < strlen(_str));
	return _str[pos];
}

const char& operator[](size_t pos) const 
{
	assert(pos < strlen(_str));
	return _str[pos];
}

int main()
{
	string s1("hello world");
	for (int i = 0; i < s1.size(); ++i)
	{

		cout << s1[i];
	}
	return 0;
}

 

1.2 c_str

我们发现c_str返回的就是该字符串以及末尾的'\0',我们可以使用c_str()来进行字符串的打印,遇到'\0'就停止。

实现代码:

		const char* c_str() const
		{
			return _str;
		}

 

1.3 迭代器

迭代器:字符串的迭代器底层是一个char* 的原生指针,因此我们使用string的迭代器时就像指针一样使用即可,但是其他的容器底层实现并不一定都是原生指针。

	typedef char* iterator;
	typedef const char* const_iterator;
	iterator begin()
	{
		return _str;
	}

	iterator begin() const
	{
		return _str;
	}
	iterator end()
	{
		return _str + _size;
	}

	iterator end() const
	{
		return _str + _size;
	}

我们使用迭代器来遍历一下字符串:

int main()
{
	string s1("hello world");
	string::iterator it = s1.begin();
	while (it != s1.end())
	{
		cout << *it << " ";
		it++;
	}
	return 0;
}

 

1.4 范围for

范围for的使用

	for (auto e : s1)
	{
		cout << e << " ";
	}

 

范围for的底层原理:范围for的底层原理其实就是迭代器。我们如何来验证呢,我们可以将自己实现的迭代器屏蔽起来,再使用范围for进行遍历发现就会出现报错。  

2、增

2.1.push_back

通过查询文档,我们知道了push_back的作用是将一个字符添加到目标字符串后。

方法:

1、首先我们肯定要判断是否需要扩容。如果_size == _capacity ,说明满了,需要扩容。

扩容的方法:开辟一个2倍的新空间,将字符串拷贝到新空间,现有的空间释放掉即可。

2、扩容完毕后我们在下标为_size的位置加入新增字符。

3、最后我们将_size++,并处理'\0'即可。

实现代码:

		void push_back(char ch)
		{
			if (_size == _capacity)
			{
				char* tmp = new char[_capacity * 2 + 1];
				strcpy(tmp, _str);
				delete[] _str;
				_str = tmp;
				_capacity *= 2;

				//reserve(_capacity == 0?4:_capacity*2);
			}

			_str[_size] = ch;
			++_size;
			_str[_size] = '\0';

			//insert(_size, ch);

		}

2.2. 重载 += (char ch)

我们在日常写代码时很少会使用push_back,我们经常会使用 += ,因此我们也有必要实现一下 +=,+= 的实现可以复用 push_back。

代码实现:

		string& operator+=( char ch)
		{
			push_back(ch);
			return *this;
		}

 2.3. append

前两个接口针对新增一个字符,append接口是将一个字符串新增到源字符串后。

方法:

1、首先,我们依然要考虑源字符串是否需要扩容,这次的扩容和push_back的扩容仍有区别,push_back由于只新增一个字符,因此在源字符串大小的基础上扩容2倍是足够的;append如果也是在源字符串的大小上扩容2倍的话并不能保证空间足够,因为并不知道新字符串的大小。那么确保新空间的大小一定足够呢?因此我们只需要计算源字符串的_size + 新字符串的_size的和,这个和就是新空间的大小。这也一定能确保新空间足够。因此我们可以使用reserve接口(该接口实现在 5.1)

2、只需要修改_size.

代码实现:

		void append(const char* str)
		{
			size_t len = _size + strlen(str);
			if (len > _capacity)
			{
				reserve(len);
			}
			strcpy(_str + _size, str);
			_size = len;
			//insert(_size, str);
		}

2.4.重载 += (char*  str)

+=字符串实现原理也是直接复用append

代码实现:

	string& operator+=(const char* str)
	{
		append(str);
		return *this;
	}

2.5. insert (任意位置插入)

2.5.1 任意位置插入一个字符

方法:

1、首先:判断pos位置的合法性。

2、其次:判断是否需要扩容,如果满了则需要扩容(2倍扩即可)

3、再者:从_size+1位置开始从后往前分别将每个字符向后移动一位,当end等于pos位置时,移动结束

4、最后:在pos位置插入新字符,修改_size

代码实现如下:

string& insert(size_t pos, char ch)
{
	assert(pos <= _size);
	//判断size
	if (_size == _capacity)
	{
		reserve(_capacity == 0 ? 4 : _capacity * 2);
	}

	size_t end = _size+1;
	while (end > pos)
	{
		_str[end] = _str[end-1];
		--end;
	}
	_str[pos] = ch;
	++_size;
	return *this;
}

注:当pos == size时,相当于push_back,因此push_back可以复用insert。 

2.5.2 任意位置插入一个字符串

任意位置插入一个字符串时原理基本和插入一个字符相同,需要注意临界条件即可。

方法:

1、首先:判断pos位置的合法性。

2、其次:判断是否需要扩容,如果满了则需要扩容,这里的扩容和append的扩容原理相同,使用reserve扩。

3、再者:挪动数据。 依然是从后往前挪。此时end = size + len(len = strlen(str)),依次将end - len位置的字符挪动到end位置,每挪一个字符,end--,当 end == pos+len - 1时候说明挪动结束。

4、最后,插入字符串,修改_size即可。

		string& insert(size_t pos, const char* str)
		{
			assert(pos <= _size);
			size_t len = strlen(str);
			if (len == 0)
			{
				return *this;
			}
			if (_size + len > _capacity)
			{
				reserve(_size + len);
			}
			//挪动数据
			size_t end = _size + len;
			//while(end >= end+len)
			while (end > pos+len-1)
			{
				_str[end] = _str[end-len];
				--end;
			}
			//插入数据  
			size_t i = 0;
			while (i < len)
			{
				_str[pos+i] = str[i];
				++i;
			}
			_size += len;
			return *this;
		}

3.删

3.1 earse

库中提到了一个npos,我们可以看一下npos到底是什么?

npos的大小肯定是大于给定len的大小,因此就是有多少删多少。

通过库里面的定义,erase的作用是在pos位置往后删除len个字符

其中erase删除可分为这几种情况:

情况1:如果len == npos,或者pos + len >= _size,说明要删完,后面删完的话只需要在pos位置赋成 '\0' 即可。

情况2:没有删完,删除一部分,我们可以定义一个begin = pos + len,让begin 位置的字符赋值给begin - len 位置的字符,当begin == _size时,就自动将 ' \0 ' 赋值过去了,因此结束的条件是begin > _size。 最后再处理一下 _size -= len 

代码实现:

		string& earse(size_t pos, size_t len = npos)
		{
			assert(pos < _size);
			if (len == npos || pos + len >= _size)
			{
				_str[pos] = '\0';
				_size = pos;
			}
			else
			{
				size_t begin = pos + len;
				while (begin <= _size)
				{
					_str[begin-len] = _str[begin];
					++begin;
				}
				_size -= len;
			}
			return *this;
		}

4.查

4.1 查找一个字符

find查字符串返回第一次出现该字符的下标,这个实现也比较简单。 

		size_t find(char ch,size_t pos = 0)
		{
			for (; pos < _size; ++pos)
			{
				if (_str[pos] == ch)
				{
					return pos;
				}
			}
			return npos;
		}

4.2 查找一个字符串

查找子串可以使用C语言中的strstr

		size_t find(const char* str, size_t pos = 0)
		{
			const char* p = strstr(_str + pos, str);
			//kmp算法 -- 效率不好 不实用
			//bm算法
			if (p == nullptr)
			{
				return npos;
			}
			else
			{
				return p - _str;
			}
		}

4.3 字符串比较

这里我们比较的是字符的ASCII码值的大小,可以使用strcmp

    bool operator<(const string& s1, const string& s2)
	{
		return strcmp(s1.c_str(), s2.c_str()) < 0;
	}
	bool operator==(const string& s1, const string& s2)
	{
		return strcmp(s1.c_str(), s2.c_str()) == 0;
	}
	bool operator<=(const string& s1, const string& s2)
	{
		return s1 < s2 || s1 == s2;
	}
	bool operator>(const string& s1, const string& s2)
	{
		return !(s1 <= s2);
	}
	bool operator>=(const string& s1, const string& s2)
	{
		return !(s1 < s2);
	}
	bool operator!=(const string& s1, const string& s2)
	{
		return !(s1 == s2);
	}

5.改

5.1 reserve

 reserve作用就是将string的容量扩充到n个。

方法:首先需要判断n是否大于_capacity,如果n小于等于_capacity则不进行容量修改,如果n大于_capacity,则需要进行扩充到n。

代码实现:

void reserve(size_t n)
{
	if (n > _capacity)
	{
		char* tmp = new char[n + 1];
		strcpy(tmp, _str);
		delete[] _str;
		_str = tmp;

		_capacity = n;
	}
}

5.2 resize 

resize的作用是将字符串的大小调整为n个字符。resize修改的是size。

resize和reserve的区别:reserve只对空间进行处理,不影响值;resize不仅会改变空间,还会改变size,会改变字符的值。

情况1: resize的n大于当前字符串的长度。

用如图举例,s1中存放 hello world,大小只有15个空间,现在要resize(20,'x'),此时空间不够,需要扩容,开辟新空间后将源字符串内容拷贝下来并在后面加满 'x'

 

情况2: resize的n小于当前字符串_capacity的长度。但是大于字符串_size的长度

如下图所示,在这种情况下,s1的_capacity不会变,而是将_size增加到n,并在字符串后弥补目标字符。

情况3: resize的n小于当前字符串_resize

如下图所示,在这种情况下,s1的_size修改为目标大小n,并改变值,只会保留前n个字符的内容

在了解resize的作用后,我们也进行了不同情况的分类,模拟实现代码如下:

		//扩空间+初始化
	    //删除部分数据,保留前n个
		void resize(size_t n,char ch = '\0')
		{
			if (n < _size)
			{
				_size = n;
				_str[_size] = '\0';
			}
			else
			{
				if (n > _capacity)
				{
					reserve(n);
				}
				for (size_t i = _size; i < n; ++i)
				{
					_str[i] = ch;
				}
				_size = n;
				_str[_size] = '\0';
			}
			
		}

 (本篇完)

  • 22
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 19
    评论
评论 19
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小白又菜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值