1.string的介绍
string是表示字符串的字符串类,该类的接口与常见的容器接口差不多,增加了一些特殊接口来处理字符串,该类存在于标准库STL中,在使用该类时需要包含头文件#include <string>。
2.模拟string的成员
string通常来说存在三个内置类型成员。
~一个char类型的指针指向字符串
~一个size_t类型的容量表示字符串的空间总大小。
~一个size_t类型来表示字符串有效字符的长度。
#pragma once
#include <assert.h>
#include <iostream>
using namespace std;
namespace L
{
class string
{
public:
const static size_t npos = -1;
typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
private:
char* _str;
size_t _capacity;
size_t _size;
};
string的public区中通常也会存在一个静态常量npos,这个npos很大,通常遍历完字符串会返回npos,因为默认字符串的大小没有npos那么大。
自己模拟实现的string可以放在自己创建的命名空间里。
3.模拟string函数接口
(1)构造函数
string(const char* str = "")
{
_size = strlen(str);
_capacity = _size;
_str = new char[_size + 1];
strcpy(_str, str);
}
这里提供一个带缺省值为’\0‘的构造函数,_str在开辟空间时要多开一个,为了放'\0'。
(2)析构函数
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
注意:delete时要加上【】。析构函数用于清理。
(3)拷贝构造函数
拷贝构造函数有两种写法,一种是传统写法,一种是现代写法。
传统写法指自己开空间。
/*string(const string& s)
:_str(new char[s._capacity + 1])
,_size(s._size)
,_capacity(s._capacity)
{
strcpy(_str, s._str);
}*/
现代写法指利用构造函数直接构造一个局部对象,然后再利用swap函数来交换一下,这里swap函数可以自己简单实现。
void swap(string& tmp)
{
::swap(_str, tmp._str);
::swap(_size, tmp._size);
::swap(_capacity, tmp._capacity);
}
string(const string& s)
:_str(nullptr)
, _size(0)
, _capacity(0)
{
string tmp(s._str);
swap(tmp);
}
(4)在任意位置插入与删除字符或字符串
string& insert(size_t pos, char ch)
{
assert(pos <= _size);
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
size_t end = _size + 1;
while (end > pos)
{
_str[end] = _str[end - 1];
--end;
}
_str[pos] = ch;
++_size;
return *this;
}
string& insert(size_t pos, const char* str)
{
assert(pos <= _size);
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);
}
size_t end = _size + len;
while (end >= pos+len)
{
_str[end] = _str[end - len];
--end;
}
strncpy(_str+pos,str,len);
_size+=len;
return *this;
}
插入函数一开始都要先判断容量够不够,如果不够需要扩容,然后在字符串的末尾开始迭代字符往后挪位。字符串和字符的扩容大小不同,需要计算出插入的字符串长度,然后扩长度加原有字符长度的容量。
void erase(size_t pos, size_t len = npos)
{
assert(pos < _size);
if (len == npos || pos + len >= _size)
{
_str[pos] = '\0';
_size = pos;
}
else
{
strcpy(_str + pos, _str + pos + len);
_size -= len;
}
}
在任意位置删除len长度字符函数需要注意的是len缺省值是npos,也就是整个字符串。当len过大或pos+len的长度大于有效字符,那么就认为是删除pos位后所有字符。否则就是直接拷贝pos+len位置的字符到需要删除的位置覆盖。最后有效数据的个数记得需要减去len。
(5)扩容函数reserve与resize
resize与reserve是不同的两个扩容函数。
reverse为字符串预留空间。resize可以开空间并初始化,也可以减小空间删除字符。
void reserve(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n+1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
void resize(size_t n,char ch = '\0')
{
if (n > _size)
{
reserve(n);
for (size_t i = _size; i < n; ++i)
{
_str[i] = ch;
}
_str[n] = '\0';
_size = n;
}
(6)尾插函数
尾插函数包括尾插一个字符和尾插一个字符串。
尾插函数也可以在实现了insert后复用insert来尾插。
void push_back(char ch)
{
/*if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
_str[_size] = ch;
++_size;
_str[_size] = '\0';*/
insert(_size, ch);
}
void append(const char* str)
{
/*size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);
}
strcpy(_str + _size, str);
_size += len;*/
insert(_size, str);
}
(7)运算符重载赋值与查找
string& operator+=(char ch)
{
push_back(ch);
return *this;
}
string& operator+=(const char* str)
{
append(str);
return *this;
}
string& operator=(string s)
{
swap(s);
return *this;
}
可以直接复用之前的函数。
size_t find(char ch, size_t pos = 0) const
{
assert(pos < _size);
for (size_t i = pos; i < size(); ++i)
{
if (_str[i] == ch)
{
return i;
}
}
return npos;
}
size_t find(const char* sub, size_t pos = 0) const
{
assert(sub);
assert(pos < _size);
const char* ret = strstr(_str + pos, sub);
if (ret == nullptr)
{
return npos;
}
else
{
return ret - _str;
}
}
查找函数找一个字符和一个字符子串。找到就返回下标。
(8)找子串函数与各种运算符重载
string substr(size_t pos, size_t len = npos) const
{
assert(pos < _size);
size_t reallen = len;
if (len == npos || pos + len >= _size)
{
reallen = _size - pos;
}
string sub;
for (size_t i = 0; i < reallen; ++i)
{
sub += _str[pos + i];
}
return sub;
}
bool operator>(const string& str) const
{
return strcmp(_str, str._str) > 0;
}
bool operator==(const string& str) const
{
return strcmp(_str, str._str) == 0;
}
bool operator>=(const string& str) const
{
return *this > str || *this == str;
}
bool operator<(const string& str) const
{
return !(*this >= str);
}
bool operator<=(const string& str) const
{
return !(*this > str);
}
bool operator!=(const string& str) const
{
return !(*this == str);
}
运算符重载实现了两个,其他直接复用即可。
(9)流提取与流插入
为了实现流提取与流插入能够兼容自定义类型,于是在类外定义两个自己的函数
ostream& operator<<(ostream& out, const string& s)
{
for (size_t i = 0; i < s.size(); ++i)
{
out << s[i];
}
return out;
}
istream& operator>>(istream& in, string& s)
{
s.clear();
char ch;
ch = in.get();
const size_t N = 32;
char buff[N];
size_t i = 0;
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == N - 1)
{
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
buff[i] = '\0';
s += buff;
return in;
}
(10)其他特殊需求函数接口
const char* c_str() const
{
return _str;
}
size_t size() const
{
return _size;
}
size_t capacity() const
{
return _capacity;
}
const char& operator[](size_t pos) const
{
assert(pos < _size);
return _str[pos];
}
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
void clear()
{
_str[0] = '\0';
_size = 0;
}