【C++】一篇文章带你深度理解string内部实现!!

本文详细介绍了如何模拟实现C++标准库中的string类,包括构造函数、析构函数、拷贝构造、c_str接口、大小和容量获取、迭代器、数组操作、动态扩容、插入和删除元素、查找、子串提取、交换以及关系运算符和流处理等关键功能。
摘要由CSDN通过智能技术生成

string无论是日常使用还是刷题都是经常使用的容器,那么他的底层实现到底是怎样的呢?
本篇文章将实现常用的底层接口
关于更多接口可以去cplusplus.com这个网站查看。
因为我们是模拟实现,所以函数形式是跟着里走的

目标接口:

  1. 构造函数(附拷贝构造)
  2. 析构函数
  3. 赋值运算符重载
  4. c_str接口
  5. 返回sizecapacity的接口
  6. 迭代器接口
  7. []运算符重载
  8. reserveresize接口
  9. 各种尾插接口
  10. insert接口
  11. erase接口
  12. substr接口
  13. find接口
  14. swap接口
  15. 关系运算符接口
  16. 流(<< && >>)接口

实现时顺序会有一小点偏差,因为深浅拷贝的问题(也就是拷贝构造与赋值运算符重载)

实现目标接口:

私有成员变量:

若是我们实现过顺序表即可发现与顺序表的变量是很相似的。

	private:
		char* _str;
		size_t _size;
		size_t _capacity;

拷贝构造:

我们只实现两个常用的构造函数,因为string设计的接口实在太多了~

无参构造函数:

		string()
			:_size(0)
		{
			_str = new char[1];
			_capacity = _size;
			_str[0] = 0;
		}

注意:_str不能给nullptr,这样只要是需要访问字符传的情况下都会崩溃(例如当我们使用c_str接口打印字符串时)

带参构造:

		string(const char* str)
		{
			_str = new char[strlen(str) + 1];
			strcpy(_str, str);
			_size = strlen(str);
			_capacity = _size;
		}

合并后:

		string(const char* str = "")
		{
			_str = new char[strlen(str) + 1];
			strcpy(_str, str);
			_size = strlen(str);
			_capacity = _size;
		}

注意:我们传一个空字符串即可很完美的完成全缺省函数。

析构函数:

		~string()
		{
			delete[] _str;
			_capacity = _size = 0;
		}

c_str:

在这里插入图片描述

		const char* c_str() const
		{
			return _str;
		}

我们加上右边的const表示:
不管是否是const对象都可以调用
左边的const表示:
不希望返回的值被修改

size与capacity接口:

在这里插入图片描述

		size_t size() const
		{
			return _size;
		}

		size_t capacity() const
		{
			return _capacity;
		}

右边的const理由同上

迭代器:

各种环境下的迭代器是不同的,
linux下的迭代器是直接使用原生指针进行实现。
vs下是封装进行实现(在我们模拟实现list时会有更好地理解)。
而我们模拟实现使用原生指针进行模拟,这样对于初学者有更好的理解。

public:
	typedef char* iterator;
	typedef const char* const_iterator;

在这里插入图片描述
我们发现迭代器是有两个实现版本的,
因为有时我们的迭代器需要进行修改string内的元素,
有时const对象也需要调用迭代器进行遍历元素,故而实现两个版本

或许对于左边的const有些疑惑,认为加或不加都可以,那我们看这样一个例子:

	void test_string()
	{
		const string s1("hello world");
		string::iterator it = s1.begin();
		(*it)++;
		cout << s1 << endl;
	}

我们既然const了s1对象,那么就是希望不被修改,可是上图代码可以修改s1的内容,故需要加const修饰

实现代码:

		iterator begin()
		{
			return _str;
		}

		iterator end() 
		{
			return _str + _size;
		}

		const_iterator begin() const
		{
			return _str;
		}

		const_iterator end() const
		{
			return _str + _size;
		}

[ ]重载:

在这里插入图片描述
这个也是同理

		char& operator[](size_t pos)
		{
			assert(pos < _size);
			return _str[pos];
		}
		const char& operator[](size_t pos) const
		{
			assert(pos < _size);
			return _str[pos];
		}

reserve && resize:

		void reserve(size_t n)
		{
			if (_capacity < n)
			{
				char* tmp = new char[n + 1];
				strcpy(tmp, _str);
				delete[] _str;
				_str = tmp;
				_capacity = n;
			}
		}

		void resize(size_t n, char ch = '\0')
		{
			if (n <= _size)
			{
				_str[n] = '\0';
			}
			else
			{
				if (n > _capacity)
				{
					reserve(n);
				}
				for (int i = _size; i < n; i++)
				{
					_str[i] = ch;
				}
				_str[n] = '\0';
			}
			_size = n;
		}

关于下标的操作我有一个比较舒服的理解方法:
在这里插入图片描述
我知道这是一个很普遍的结论,但是我在以往都没有进行很好的利用这个结论,最近发现这个东西对于做关于下标的分析时和开挂一样好用。
不知道你们可不可以get到这个点。

尾插的接口:

		void push_back(char ch)
		{
			if (_capacity == _size)
			{
				reserve(_capacity == 0 ? 4 : 2 * _capacity);
			}
			_str[_size++] = ch;
			_str[_size] = '\0';
		}

		void append(const char* str)
		{
			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				reserve(_size + len);
			}
			strcpy(_str + _size, str);
			_size += len;
		}

		void operator+=(const char* str)
		{
			append(str);
		}

		void operator+=(char ch)
		{
			push_back(ch);
		}

insert接口:

		void insert(size_t pos, char ch)
		{
			assert(pos <= _size);

			if (_capacity == _size)
			{
				reserve(_capacity == 0 ? 4 : 2 * _capacity);
			}
			int end = _size, count = _size++ - pos + 1;
			while (count--)
			{
				_str[end + 1] = _str[end];
				end--;
			}
			_str[pos] = ch;
		}

		void insert(size_t pos, const char* str)
		{
			size_t len = strlen(str);

			if (_size + len > _capacity)
			{
				reserve(_size + len);
			}

			int end = _size, count = _size - pos + 1;
			while (count--)
			{
				_str[end + len] = _str[end];
				end--;
			}
			strncpy(_str + pos, str, len);
			_size += len;
		}

这里的挪数据我是采用count计数器的方法来实现的,我比较喜欢这样,大家选择自己喜欢的方式挪动。

erase接口:

		void erase(size_t pos, size_t len = npos)
		{
			if (len == npos || pos + len >= _size)
			{
				_str[pos] = '\0';
				_size = pos;
			}
			else
			{
				strcpy(_str + pos, _str + pos + len);
				_size -= len;
			}
		}

注意:关于npos是size_t 的-1,即为最大值。
定义时在类中声明

public:
		static const size_t npos;

类外定义:

	const size_t string::npos = -1;

也可以生命时定义。

	static const size_t npos = -1;

find接口:

		size_t find(char ch)
		{
			for (int i = 0; i < _size; i++)
			{
				if (_str[i] == ch)
				{
					return i;
				}
			}
			return npos;
		}

		size_t find(const char* str)
		{
			const char* p = strstr(_str, str);
			if (p)
			{
				return p - _str;
			}
			return -1;
		}

substr接口:

		string substr(size_t pos = 0, size_t len = npos)
		{
			string substr;

			if (len == npos || pos + len >= _size)
			{
				substr = _str + pos;
			}
			else
			{
				while (len--)
				{
					substr += _str[pos++];
				}
			}
			return substr;
		}

swap接口:

为什么我们的算法库里有一个swap,但还是要再单独写一个呢。
因为库中的效率太低了,先拷贝构造一个,在深拷贝两次,代价太大,在这里插入图片描述
故我们需要一个更快捷的swap接口,直接交换两个对象_str的指针和capacity与size。

		void swap(string& s)
		{
			std::swap(_str, s._str);
			std::swap(_size, s._size);
			std::swap(_capacity, s._capacity);
		}

关系运算符重载接口:

为全局实现。目的是为了更灵活的比较

	bool operator==(const string& s1, const string& s2)
	{
		int ret = strcmp(s1.c_str(), s2.c_str());
		return ret == 0;
	}

	bool operator<(const string& s1, const string& s2)
	{
		int ret = strcmp(s1.c_str(), s2.c_str());
		return ret < 0;
	}

	bool operator<=(const string& s1, const string& s2)
	{
		return s1 < s2 || s1 == s2;
	}

	bool operator>(const string& s1, const string& s2)
	{
		return !(s1 <= s2);
	}

	bool operator>=(const string& s1, const string& s2)
	{
		return !(s1 < s2);
	}

	bool operator!=(const string& s1, const string& s2)
	{
		return !(s1 == s2);
	}

流插入与留提取重载:

	ostream& operator<<(ostream& out, const string& s)
	{
		for (auto ch : s)
		{
			out << ch;
		}
		return out;
	}

	istream& operator>>(istream& in, string& s)
	{
		s.clear();
		char buff[128];
		char ch = in.get();
		int i = 0;
		while (ch != ' ' && ch != '\n')
		{
			buff[i++] = ch;
			if (i == 127)
			{
				buff[127] = '\0';
				s += buff;
				i = 0;
			}
			ch = in.get();
		}

		if (i > 0)
		{
			buff[i] = '\0';
			s += buff;
		}
		return in;
	}

有任何问题都可以私聊博主进行沟通。

  • 19
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值