string的模拟实现

Yan. yan.好好学习

于 2024-08-07 14:32:58 发布

阅读量474

点赞数 11

分类专栏： C++ 文章标签： c++

本文链接：https://blog.csdn.net/2401_82669797/article/details/140987328

版权

C++ 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

P. S.：以下代码均在VS2019环境下测试，不代表所有编译器均可通过。 P. S.：测试代码均未展示头文件stdio.h的声明，使用时请自行添加。

在这里插入图片描述

                        博主主页：Yan. yan.
                        C语言专栏
                        数据结构专栏
                       力扣牛客经典题目专栏
                                   C++专栏

一、string的成员变量

在模拟string的时候，成员变量如下：

private:
		size_t _size;
		size_t _capacity;
		char* _str;

二、string的默认成员函数

1、构造函数

1.1、默认构造（无参构造）

构造是不进行初始化，默认为空字符串。

string()
	:_str(new char[1])
	, _size(0)
	, _capacity(0)
{
	_str[0] = '\0';
}

1.2、普通构造

思路：
1、开辟一块新空间。
2、把原数据拷贝的新空间。
3、释放新空间。
4、_str指向新空间。

//无参和全缺省合并
string(const char* str = "")
			:_size(strlen(str))
			,_capacity(_size)
		{
			_str = new char[_capacity + 1]; //多开一个空间给/0
			//strcpy(_str, str);  strcpy默认只拷贝到'\0'终止，但有些情况是要拷贝完全，包括'\0'
			memcpy(_str, str, _size + 1); //\0也需要拷贝
		}

解释：

新申请的空间往往会多申请一个，用来存放 ’ \0 ’
使用memcpy而不是使用strcpy的原因：
如果使用strcpy，这样的情况会出现问题：
“hello\0xxxxx”
strcpy默认只拷贝到’\0’,memcpy按照字节数拷贝，包括’\0’也会拷贝

1.3、无参构造和全缺省构造合并

合并如下：

string(const char* str = "")
			:_size(strlen(str))
			,_capacity(_size)
		{
			_str = new char[_capacity + 1]; //多开一个空间给/0
			//strcpy(_str, str);  strcpy默认只拷贝到'\0'终止，但有些情况是要拷贝完全，包括'\0'
			memcpy(_str, str, _size + 1); //\0也需要拷贝
		}

如果没有传参，默认是空字符串，如果传参，则使用该参数。

深拷贝和浅拷贝

浅拷贝：也叫位拷贝，编译器只是将对象中的值拷贝过来。浅拷贝可能会导致多个对象共用一份资源，当一个对象销毁时就会将该资源释放掉，而此时另一些对象不知道该资源已经被释放，以为还有效，所以当继续对资源进项操作时，就会发生发生了访问违规。

一句话来说：一块空间由多个对象共同管理。

深拷贝：每个对象有自己独立的空间，不会和其他对象共享，他们之间互不影响。

2、拷贝构造

拷贝构造是深拷贝，所以我们要实现深拷贝。

思路：
开辟一个和原字符串一样大小的空间。
将原字符串的内容拷贝到新空间。

string(const string& s)
		{
			_str = new char[s._capacity + 1];
			memcpy(_str, s._str, _size + 1);
			_size = s._size;
			_capacity = s._capacity;
		}

3、赋值运算符重载

赋值：例如s1= s2。

思路：
先用s拷贝构造一个临时对象。
释放原str空间。
将str指针指向临时对象，此时str就是s的拷贝了。
tmp临时对象在结束调用该函数之后编译器会自动调用析构函数进行销毁
返回*this

string& operator=(const string& s)
		{
			if (this != &s)
			{
				char* tmp = new char[s._capacity + 1];
				memcpy(tmp, s._str, _size+1);
				delete[] _str;
				_str = tmp;
				_size = s._size;
				_capacity = s._capacity;
			}
		}

4、析构函数

~string()
		{
			if (_str)
			{
				delete[] _str;
				_str = nullptr;
				_size = _capacity = 0;
			}
		}

三、[]的下标访问和iterator迭代器

1、operator[]重载

普通[]

char& operator[](size_t pos)
		{
			//_size 的位置是'\0'
			assert(pos < _size);
			return _str[pos];
		}

const修饰的[]

const char& operator[](size_t pos) const
		{
			assert(pos < _size);
			return _str[pos];
		}

2、begin迭代器

typedef char* iterator;
typedef const char* const_iterator;

iterator begin()
{
	return _str;
}

const_iterator begin() const
{
	return _str;
}

3、end迭代器

iterator end()
{
	return _str + _size;
}

const_iterator end() const
{
	return _str + _size;
}

四、对容器空间操作

1、size()

返回_size即可

size_t size() const
		{
			return _size;
		}

2、capacity（）

size_t capacity() const
		{
			return _capacity;
		}

3、empty

判空

bool empty() const
		{
			return _size == 0;
		}

4、reserve——重要

reserve函数第对对象进行扩容操作的。

思路：
如果需要扩容的空间小于原空间，则不会进行缩容操作
否则，进行扩容操作。
先申请一块新的空间，然后将原空间的数据拷贝到新空间
再释放原空间，将原空间的指针指向新空间。
更新capacity即可。

void reserve(size_t n)
		{
			//不仅仅append，push_back会用到，其他地方也可能用到reserve，不会缩容
			//如果是缩容的情况的话，不允许发生
			if (n > _capacity)
			{
				char* tmp = new char[n + 1]; //留给'\0'
				//strcpy(tmp, _str);
				memcpy(tmp, _str, n + 1);

				delete[] _str;//如果不销毁，就会出现内存泄露。
				_str = tmp;
				_capacity = n; // 不能等于 n + 1，容量不包含'\0'
			}

注意：我们需要用memcpy拷贝更合理，因为实际情况会出现诸如"hello\0world"的情况

5、resize——重要

resize是对对象进行扩容，然后同时将size提升到指定的数据大小的。
库的实现是：将对象调整空间到指定大小，如果比原容量大，且不给指定需要填充的字符，多出来的空间默认填充为’\0’。

思路：
如果要调整的大小小于或者等于当前容量，则不会进行缩容，只会让size调整，默认用’\0’填充size位置即可
如果要调整的大小大于当前容量，则调用reserve函数进行扩容，如果不给指定的字符，则默认将后面的空间填充成’\0’即可。

void resize(size_t n, char c = '\0')
		{
			if (n < _size)
			{
				_size = n;
				_str[_size] = '\0';
			}
			else
			{
				//先扩容
				reserve(n);
				//将后面的空间全部填充成c
				for (size_t i = _size; i < n; i++)
				{
					_str[i] = c;
				}
				_size = n;
				_str[_size] = '\0';
			}
		}

五、增删查改工作

1、push_back（）

push_back在库中的实现是，向字符串末尾插入一个字符。

思路：
首先需要检查容量，如果容量不足则需要扩容。
再将最后一个字符插入到’\0’位置
size++，然后将size位置放置’\0’

void push_back(char c)
{
	//满了，要扩容
	if (_size == _capacity)
	{
		reserve(_capacity == 0 ? 4 : 2 * _capacity);//不需要再+1,reserve的扩容机制是会自己多给几个空间
	}
	//在'\0'后面尾插
	_str[_size] = c;

	++_size;
	//记得要在后面+'\0'
	_str[_size] = '\0';
}

2、append

append函数是在字符串末尾追加一个字符串。

思路：
检查容量
在字符串末尾开始拷贝要追加的字符串即可。
需要注意的问题是，检查容量时，扩容不能扩2倍，因为可能追加的字符串比2倍的容量还长，具体请看代码。

void append(const char* str)
{
	size_t len = strlen(str);
	if (_size + len > _capacity)
	{
		//追加一个字符串，扩二倍不一定够，所以至少扩容到_size + len;
		reserve(_size + len); //不需要再+1,reserve的扩容机制是会自己多给几个空间。
	}

	//strcpy(_str + _size, str);
	memcpy(_str + _size, str, len + 1);//memcpy默认会拷贝'\0'

	_size += len;
	_str[_size] = '\0';
}

3、operator+=

对于这个运算符重载，有两种情况

+=一个字符
+=字符串
我们直接复用push_back函数和append函数即可。

string& operator+=(char c)
{
	push_back(c);
	return *this;
}
string& operator+=(const char* str)
{
	append(str);
	return *this;
}

4、insert（）

在pos位置插入n个字符c。

void insert(size_t pos, char ch)
{
	assert(pos <= _size);
	//扩容
	if (_size == _capacity)
	{
		reserve(_capacity == 0 ? 4 : _capacity * 2);
	}
	
	size_t end = _size + 1;
	while (end > pos)
	{
		_str[end] = _str[end - 1];
		--end;
	}

	_str[pos] = ch;
	_size++;
}

在pos位置插入一个字符串

void insert(size_t pos, const char* str)
		{
			assert(pos <= _size);
			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				reserve(_size + len);
			}

			int end = _size;
			while (end >= (int)pos)
			{
				_str[end + len] = _str[end];
				end--;
			}

			strncpy(_str + pos, str, len);
			_size += len;
		}

5、erase()

删除pos位置开始的len个字符。
如果不给参数，默认从0开始删除所有字符。
注意：npos表示无穷大

思路：
情况一：如果要删除所有元素，直接将size置为0，然后将size位置设置成’\0’即可。
情况二：在pos位置删除len个字符
将pos位置开始的len个字符从前往后挪动即可，（'\0’也需要挪动）

void erase(size_t pos, size_t len = npos)
		{
			assert(pos <= _size);
			if (len == npos || pos + len >= _size)
			{
				_str[pos] = '\0';
				_size = pos;
			}
			else
			{
				size_t begin = pos + len;
				while (begin <= _size)
				{
					_str[begin - len] = _str[begin];
					begin++;
				}
				_size -= len;
			}
		}

6、find（）

版本1：在字符串中找出第一次出现的字符c，返回该位置下标。

size_t find(char ch, size_t pos = 0)
		{
			for (size_t i = 0; i < _size; i++)
			{
				if (_str[i] == ch)
				{
					return i;
				}
			}
			return npos;
		}

版本2：在字符串中找出一个指定的子串，返回第一次出现的位置。

size_t find(const char* sub, size_t pos = 0)
		{
			const char* p = strstr(_str + pos, sub);
			if (p)
			{
				return p - _str;
			}
			else
			{
				return npos;
			}
		}

7、substr()

该函数的功能是：从pos位置开始，返回len个字符组成的字符串。
相当于返回一个特定的子串。

string substr(size_t pos, size_t len = npos)
		{
			string s;
			size_t end = pos + len;
			if (len == npos || pos + len >= _size)
			{
				len = _size - len;
				end = _size;
			}

			s.reserve(len);
			for (size_t i = pos; i < pos + len; i++)
			{
				s += _str[i];
			}

			return s;
		}

六、比较运算符重载

1、operator<

bool operator<(const string& s) const
		{
			return strcmp(_str, s._str) < 0;
		}

2、operator==

思路：
只要两个字符串相等，则它们的size必定相等。
用memcmp比较即可。

bool operator==(const string& s) const
		{
			if (_size != s._size)
				return false;

			return strcmp(_str, s._str) == 0;
		}

3、operator<=,>,>=,!=

bool operator<=(const string& s) const
		{
			return *this < s || *this == s;
		}

		bool operator>(const string& s) const
		{
			return !(*this <= s);
		}

		bool operator>=(const string& s) const
		{
			return !(*this < s);
		}

		bool operator!=(const string& s) const
		{
			return !(*this == s);
		}

七、流插入和流提取

注意：流插入和流提取均为全局函数，不是类对象的成员函数。

1、流插入<<（流插入和c_str()的区别）

库的流插入的实现是，完整地打印出字符串的所有内容，包括’\0’

而c_str()函数是返回字符串的首地址，那么就可以通过首地址打印，然而会遇到’\0’停止。

ostream& operator<<(ostream& out, const string& s)
{
	for (size_t i = 0; i < s.size(); i++)
	{
		out << s[i];
	}
	/*for (auto ch : s)
		out << ch;*/

	return out;
}
const char* c_str() const
{
    return _str;
}

2、流提取

库的实现是：
遇到在遇到字符之前遇到的空格’ ‘和斜杠n换行符’\n’，都会刷新缓冲区，会重新进行读取。
所以可以在这里使用get函数进行缓冲区的刷新，get函数会一直读取，遇到空格或者换行不会停止。
在遇到字符之后，如果再遇到空格’ ‘或者斜杠n换行符’\n’，默认是多字符串的输入。
使用buf数组来减少扩容的代价。

istream& operator>>(istream& in, string& s)
	{
		s.clear();

		char ch;
		//in >> ch;
		ch = in.get();
		s.reserve(128);

		while (ch != ' ' && ch != '\n')
		{
			s += ch;
			//in >> ch;
			ch = in.get();
		}

		return in;
	}