一、本篇接口实现包括
成员函数包括:
string(const char* str = "")
~string()
void swap(string& s)
string(const string& s)//传统写法
string(const string& s)//现代写法
string& operator=(const string& s)//传统写法
string& operator=(string s)//现代写法
void reserve(size_t n)
void resize(size_t n, char ch = '\0')
void push_back(char ch)
void pop_back()
void append(const char* str)
const char* c_str()const
size_t size()const
size_t capacity()const
iterator begin()
iterator end()
const_iterator begin()const
const_iterator end()const
bool empty()const
void clear()
char& operator[](size_t pos)
const char& operator[](size_t pos)const
string& operator+=(char ch)
string& operator+=(const char* str)
string& insert(size_t pos, char ch)
string& insert(size_t pos, const char* str)
string& erase(size_t pos, int n = npos)
size_t find(char ch, size_t pos = 0)
size_t find(const char* str, size_t pos = 0)
全局函数包括:
std::ostream& operator<<(std::ostream& out, const string& s)
std::istream& operator>>(std::istream& in, string& s)
bool operator>(const string& s1, const string& s2)
bool operator==(const string& s1, const string& s2)
bool operator>=(const string& s1, const string& s2)
bool operator<(const string& s1, const string& s2)
bool operator<=(const string& s1, const string& s2)
bool operator!=(const string& s1, const string& s2)
这里我只挑选部分接口进行详细解析,因为其他接口实现起来实在容易。由于移动构造和移动赋值属于c++11的新增范围,这里就不涉及了,笔者会在c++11章节补充这部分的内容。
二、接口全实现
https://gitee.com/zxlfx/c-code-warehouse/tree/master/2022_7_19
三、部分接口详解
3.1拷贝构造的传统写法与现代写法
string(const string& s)//传统写法 { _str = new char[s._capacity + 1]; _capacity = s._capacity; _size = s._size; strcpy(_str, s._str); } void swap(string& s) { std::swap(_str, s._str); std::swap(_size, s._size); std::swap(_capacity, s._capacity); } string(const string& s)//现代写法 :_str(nullptr), _size(0), _capacity(0) { string temp(s._str); swap(temp); }
传统写法是老老实实开空间,然后将数据拷贝至新空间,而现代写法是取出s的_str,再调用string(const char* str = "")生成临时对象temp,然后交换*this与temp的_str,_size,_capacity。这就相当于让temp去帮你创建一个拷贝对象,然后夺取temp的资源,但temp在销毁的时候会调用析构函数,此时它的_str是原本this的_str,因此在交换_str之前,需要将this的_str置为空,否则temp调用析构函数时会崩溃。
3.2赋值重载的现代写法和传统写法
string& operator=(const string& s)//传统写法 { if (this != &s) { char* temp = new char[s._capacity + 1]; strcpy(temp, s._str); delete[] _str; _str = temp; _size = s._size; _capacity = s._capacity; } return *this; } string& operator=(string s)//现代写法 { swap(s); return *this; }
相比传统写法,现代写法更简洁,只不过下面这种现代写法在给自己赋值的场景下会调用拷贝构造,效率不高,而传统写法加了不给自己赋值的判断,直接返回*this。
3.3reserve和resize
void reserve(size_t n) { if (n > _capacity) { char* temp = new char[n + 1]; strcpy(temp, _str); delete[] _str; _str = temp; _capacity = n; } } void resize(size_t n, char ch = '\0') { if (n < _size) { _str[n] = '\0'; _size = n; } else { if (n > _capacity) { reserve(n); } else { for (size_t i = _size; i < n; i++) { _str[i] = ch; } _str[n] = '\0'; _size = n; } } }
这两个函数的功能主要参考vs2019,对于reserve,如果n>capacity时就增容,n<capacity不会缩容。对于resize,如果n<size,就把size调整到n,n大于size,说明要增加数据,检验n>capacity就扩容到n,然后不断插入ch至size==n。
3.4insert和erase
string& insert(size_t pos, char ch) { assert(pos <= _size); if (_size == _capacity) { reserve(_capacity == 0 ? 4 : _capacity * 2); } char* start = _str + pos; char* end = _str + _size; while (end >= start) { *(end + 1) = *end; end--; } _str[pos] = ch; _size++; return *this; } string& insert(size_t pos, const char* str) { assert(pos <= _size); size_t size = strlen(str); if (_size + size > _capacity) { reserve(_size + size); } char* start = _str + pos; char* end = _str + _size; while (end >= start) { *(end + size) = *end; end--; } strncpy(_str + pos, str, size); _size += size; return *this; } string& erase(size_t pos, int n = npos) { assert(pos < _size); if (pos + n >= _size) { _str[pos] = '\0'; _size = pos; } else { char* start = _str + pos; char* end = _str + _size; while (start < end) { *start = *(start + n); start++; } _size -= n; } return *this; }
这里建议while判断条件使用地址比较,如果使用的是下标比较,如while(num>=pos)当pos为0时,num为0时,num进入while,然后--,此时num变为整形的最大值,因为num是size_t类型的,那么依旧会进while,导致一直循环下去。而使用地址做while判断则可以很好的规避这样的问题。
3.5<<和>>重载
std::ostream& operator<<(std::ostream& out, const string& s) { for (auto& a : s) { out << a; } return out; } std::istream& operator>>(std::istream& in, string& s) { s.clear(); int ch = 0; char buf[128] = { 0 }; int i = 0; while ((ch = in.get()) != ' ' && ch != '\n') { buf[i++] = ch; if (i == 127) { s += buf; memset(buf, '\0', sizeof(char) * 128); i = 0; } } s += buf; return in; }
这里重载<<时,为什么不直接cout<<s.c_str()呢?反而遍历s呢?主要是因为有以下情形
当s为"1 4 6 a b \0 2 3 4",打印的时候后面的元素就不能打印出来了,就只能打印1 4 6 a b。
关于>>重载中的buf,buf在这里起缓冲作用,如果s不断+=ch,那么就可能频繁的扩容,影响效率,而如果把ch放进buf里,如果buf满了,就把buf的数据放入s中,同时清空buf的数据,并将i置为0,最后也不要忘了把还没满的buf的数据放入s中。
3.6find(查找一个字符,和查找子字符串)
size_t find(char ch, size_t pos = 0) { for (size_t i = pos; i < size(); i++) { if (_str[i] == ch) { return i; } } return npos; } size_t find(const char* str, size_t pos = 0) { char* ret = strstr(_str + pos, str); if (ret != nullptr) { return ret - _str; } return npos; }
查找一个字符,遍历s即可。查找子字符串使用c语言的库函数strstr,由于find是返回下标,而strstr是返回子字符串的地址,那么pos等于ret-_str。
四、最后
以上实现只起参考作用,如有错误或者疑惑的地方,还请读友在评论区指正或者私聊我,感谢!
关于实现细节,很多地方代码读起来还是比较轻松的,这里只挑选了部分需要注意的地方进行解析,后续的stl容器会依次介绍vector、list、deque、map、set、unorderedmap、unorderedset尽请期待。