目录
一,关于string
C语言中,字符串以‘\0’作为结尾,为了方便操作,C标准库也提供了一些字符串系列的库函数,但是因为这些库函数是和字符串分开的,底层空间需要用户自己管理,而且容易越界访问。
string类介绍:
1,string类是使用char作为字符类型。
2,该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
3,使用string类时,必须包含#include头文件已经using namespace std;
二,string模拟实现
2.1 基本框架
class string
{
public:
private:
size_t _capacity;//表示目前的总空间大小
size_t _size;//表示在该空间大小中已经有了多少个字符
char* _str;//该指针指向存储的位置
};
模拟实现中绝大多数的成员函数都实现在public限定区域内。
2.2 默认成员函数
2.2.1构造函数
string(const char* str = "")
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity + 1];
//strcpy(_str, str);
memcpy(_str, str, _size + 1);
}
注意:
1,最好不要用初始化列表初始化,因为初始化次序的问题,可能会导致程序崩溃
2,这里用memcpy拷贝字符串,因为strcpy遇到\0就停止,如果要拷贝大的字符串刚好有个\0就会导致数据丢失,memcpy是根据size大小来拷贝,所以用memcpy拷贝
2.2.2拷贝构造
①传统写法
//s2(s1) 传统写法
string(const string& s)
:_str(new char[s._capacity+1])
, _size(s._size)
, _capacity(s._capacity)
{
strcpy(_str, s._str);
memcpy(_str,s._str,_capacity+1);
}
②现代写法
void swap(string& tmp)
{
::swap(_str, tmp._str);
::swap(_size, tmp._size);
::swap(_capacity, tmp._capacity);
}
//s2(s1) 现代写法
string(const string& s)
:_str(nullptr)
, _size(0)
, _capacity(0)
{
string tmp(s._str);//tmp构造的时候直接用s._str的值初始化
swap(tmp); //this->swap(tmp);然后s指向tmp,tmp指向s本来指向的nullptr,完成值交换
//调用结束后tmp通过自己的析构函数销毁
}
在下面实现operator=中,用到的也是类似的传统与现代写法
2.2.3运算符重载
①operator=
传统写法
//s1=s3 s1=s1 赋值
string& operator=(const string& s)
{
if (this != &s)
{
char* tmp = new char[s._capacity + 1];//开空间
strcpy(tmp, s._str);//交换值
delete[] _str;//删除s1原本的值
_str = tmp;
_size = s._size;
_capacity = s._capacity;
}
return *this;
}
现代写法
string& operator=(string s)
{
if (this != &s)
{
//string tmp(s._str);效果一样
string tmp(s);
swap(tmp);
}
//直接让s顶替打工人tmp
//swap(s);
return *this;
}
②operator>
bool operator>(const string& s) const
{
return strcmp(_str, s._str) > 0;
}
③operator==
bool operator==(const string& s) const
{
return strcmp(_str, s._str) == 0;
}
④operator>=
bool operator>=(const string& s) const
{
return *this > s || *this == s;
}
⑤operator<=
bool operator<=(const string& s) const
{
return !(*this > s);
}
⑥operator<
bool operator<(const string& s) const
{
return !(*this >= s);
}
⑦operator+=
//直接复用push_back
//尾插字符
string& operator+=(char ch)
{
push_back(ch);
return *this;
}
//尾插字符串
string& operator+=(const char* str)
{
append(str);
return *this;
}
⑧operator[]
//可修改[]
const char& operator[](size_t pos) const
{
assert(pos < _size);
return _str[pos];
}
//不可修改[]
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
2.2.4析构函数
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
2.3 string扩容函数实现
reserve()
void reserve(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
memcpy(tmp, _str,_size+1);//将数据拷贝到新的更大的空间
delete[] _str;//释放旧空间
_str = tmp;
_capacity = n;
}
}
resize()
void resize(size_t n, char ch = '\0')//开空间+初始化
{
if (n > _size)
{
// 插入数据
reserve(n);
for (size_t i = _size; i < n; ++i)
{
_str[i] = ch;
}
_str[n] = '\0';
_size = n;
}
else
{
// 删除数据
_str[n] = '\0';
_size = n;
}
}
2.4 string辅助小接口实现
2.4.1 size()
size_t size() const
{
return _size;
}
2.4.2 capacity()
size_t capacity() const
{
return _capacity;
}
2.4.3 empty()
bool empty() const
{
return _size == 0;
}
2.4.4 clear()
void clear()
{
if (_size == 0)
return;
_str[0] = '\0';
_size = 0;
}
2.4.5 c_str
const char* c_str() const
{
return _str;
}
2.5 string的相关操作接口
2.5.1 push_back()
void push_back(char ch)
{
//满了就扩容
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;
++_size;
_str[_size] = '\0'; //要记住处理\0
}
2.5.2 append()
void append(const char* str)
{
size_t len = strlen(str);
//满了就扩容
if (_size + len > _capacity)
{
reserve(_size + len);
}
strcpy(_str + _size, str);//直接从str的结尾开始拷贝,妙啊
_size += len;
}
2.5.3 insert
①在pos位置插入单个字符
string& insert(size_t pos, char ch)//在pos插入字符
{
assert(pos <= _size);
// 满了就扩容
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
size_t end = _size + 1;
while (end > pos)//把pos后的数据往后面移一格
{
_str[end] = _str[end - 1];
--end;
}
_str[pos] = ch;
++_size;
return *this;
}
②在pos位置插入n个字符
void insert(size_t pos, size_t n, char ch)
{
assert(pos <= _size);
//满了就扩容
if (_size + n >= _capacity)
{
reserve(_size + n);
}
int end = _size;
//如果pos为0,那么最后end会被减为负数,但由于pos是size_t,会整形提升,出现bug
while (end >= (int)pos)//为了避免上述情况,所以这里使用强转
{
_str[end + n] = _str[end];
--end;
}
for (size_t i = 0; i < n; i++)
{
_str[pos + i] = ch;
}
_size += n;
}
③从pos位置插入字符串
string& insert(size_t pos, const char* str)//在pos插入字符串
{
assert(pos <= _size);
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);
}
// 挪动数据
size_t end = _size + len;
while (end >= pos + len)
{
_str[end] = _str[end - len];
--end;
}
strncpy(_str + pos, str, len);
_size += len;
return *this;
}
2.5.4 erase()
从pos位置删除len长度
//在pos位置删除npos个数据
const static size_t npos = -1;//const static 语法特殊处理
void erase(size_t pos, size_t len = npos)
{
assert(pos < _size);
//npos没传参数时就默认把pos后面的全删完
if (len == npos || pos + len >= _size)
}
_str[pos] = '\0';
_size = pos;
}
else//在中间删,直接把删除位置后面的数据往前面覆盖
{
strcpy(_str + pos, _str + pos + len);
_size -= len;
}
}
2.5.5 find()
①从pos位置查找单个字符
size_t find(char ch, size_t pos = 0) const//找字符
{
assert(pos < _size);
for (size_t i = pos; i < _size; ++i)
{
if (ch == _str[i])
{
return i;
}
}
return npos;
}
②从pos位置查找字符串
// "hello world bit"
size_t find(const char* sub, size_t pos = 0) const//找字符串
{
assert(sub);
assert(pos < _size);
const char* ptr = strstr(_str + pos, sub);
if (ptr == nullptr)
{
return npos;
}
else
{
return ptr - _str;//找world,ptr此时在w位置,减去首地址就是位置
}
}
2.5.6 substr
截取子字符串
2.6 string迭代器实现
typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
string的迭代器其实就是一个指针,但不是每个容器的迭代器都是指针,以后的list,map和set等等链式数据结构的迭代器会被专门当作一个类来实现,以此使他们的迭代器适应更复杂的功能,这个等以后实现的时候再说
2.7 流插入和流提取实现
2.7.1 ostream<<
inline ostream& operator<<(ostream& out, const string& s)//可以不必须是友元函数
{
for (size_t i = 0; i < s.size(); ++i)
{
out << s[i];
}
return out;
}
2.7.2 istream>>
inline istream& operator>>(istream& in, string& s)
{
s.clear();//先清空
char ch;
ch = in.get();
const size_t N = 32;
char buff[N];
size_t i = 0;
//处理前置空格和换行
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == N - 1)//最后一个位置要放空出来放\0
{
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
buff[i] = '\0';
s += buff;
return in;
}
三,完整代码
#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
#include<assert.h>
using namespace std;
namespace my_string
{
class string
{
friend ostream& operator<<(ostream& _cout, const my_string::string& s);
friend istream& operator>>(istream& _cin, my_string::string& s);
public:
typedef char* iterator;
typedef const char* const_iterator;
public:
//构造函数
string(const char* str = "")
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity + 1];
memcpy(_str, str,_size + 1);
}
//拷贝构造 -- 现代写法
string(const string& s)
:_str(nullptr)
, _size(0)
, _capacity(0)
{
string tmp(s._str);
swap(tmp); //this->swap(tmp);
}
string& operator=(const string& s)
{
if (this != &s)
{
//string tmp(s);
string tmp(s._str);
swap(tmp);//this->swap(tmp)
}
return *this;
}
string& operator=(string s)
{
swap(s);
return *this;
}
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
// iterator
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
// modify
void push_back(char c)
{
// 满了就扩容
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = c;
++_size;
_str[_size] = '\0';
//insert(_size,ch);
}
string& operator+=(char c)//加字符
{
push_back(c);
return *this;
}
void append(const char* str)
{
//满了就扩容
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);
}
strcpy(_str + _size, str);
_size += len;
//insert(_size,str);
}
string& operator+=(const char* str)//加字符串
{
append(str);
return *this;
}
void clear()
{
_str[0] = '\0';
_size = 0;
}
void swap(string& s)
{
::swap(_str, s._str);
::swap(_size, s._size);
::swap(_capacity, s._capacity);
}
const char* c_str()const
{
return _str;
}
// capacity
size_t size() const
{
return _size;
}
size_t capacity() const
{
return _capacity;
}
bool empty() const
{
return _str[0] == '\0';
}
void resize(size_t n, char c = '\0')
{
if (n > _size)
{
//插入数据
reserve(n);
for (size_t i = _size; i < n; ++i)
{
_str[i] = c;
}
_str[n] = '\0';
_size = n;
}
else
{
//删除数据
_str[n] = '\0';
_size = n;
}
}
void reserve(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
// access
char& operator[](size_t index)
{
assert(index < _size);
return _str[index];
}
const char& operator[](size_t index) const
{
assert(index < _size);
return _str[index];
}
//relational operators
bool operator<(const string& s)
{
return strcmp(_str, s._str) < 0;
}
bool operator<=(const string& s)
{
return *this < s || *this == s;
}
bool operator>(const string& s)
{
return !(*this <= s);
}
bool operator>=(const string& s)
{
return !(*this < s);
}
bool operator==(const string& s)
{
return strcmp(_str, s._str) == 0;
}
bool operator!=(const string& s)
{
return !(*this == s);
}
// 返回c在string中第一次出现的位置
size_t find(char c, size_t pos = 0) const
{
assert(pos < _size);
for (size_t i = pos; i < _size; ++i)
{
if (c == _str[i])
{
return i;
}
}
return npos;
}
// 返回子串s在string中第一次出现的位置
size_t find(const char* s, size_t pos = 0) const
{
assert(s);
assert(pos < _size);
// kmp/bm
const char* ptr = strstr(_str + pos, s);
if (ptr == nullptr)
{
return npos;
}
else
{
return ptr - _str;
}
}
// 在pos位置上插入字符c/n个字符c/字符串str,并返回该字符的位置
string& insert(size_t pos, char c)
{
// 满了就扩容
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
size_t end = _size + 1;
while (end > pos)
{
_str[end] = _str[end - 1];
--end;
}
_str[pos] = c;
++_size;
return *this;
}
void insert(size_t pos, size_t n, char c)
{
assert(pos <= _size);
if (_size + n >= _capacity)
{
reserve(_size + n);
}
int end = _size;
while (end >= (int)pos)
{
_str[end + n] = _str[end];
--end;
}
for (size_t i = 0; i < n; i++)
{
_str[pos + i] = c;
}
_size += n;
}
string& insert(size_t pos, const char* str)
{
assert(pos <= _size);
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);
}
// 挪动数据
size_t end = _size + len;
while (end >= pos + len)
{
_str[end] = _str[end - len];
--end;
}
strncpy(_str + pos, str, len);
_size += len;
return *this;
}
// 删除pos位置上的元素,并返回该元素的下一个位置
string& erase(size_t pos, size_t len)
{
assert(pos < _size);
if (len == npos || pos + len >= _size)
{
_str[pos] = '\0';
_size = pos;
}
else
{
strcpy(_str + pos, _str + pos + len);
_size -= len;
}
}
private:
char* _str;
size_t _capacity;
size_t _size;
public:
const static size_t npos = -1;
};
inline ostream& operator<<(ostream& out, const string& s)
{
for (size_t i = 0; i < s.size(); ++i)
{
out << s[i];
}
return out;
}
inline istream& operator>>(istream& in, string& s)
{
s.clear();
char ch;
ch = in.get();
const size_t N = 32;
char buff[N];
size_t i = 0;
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == N - 1)
{
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
buff[i] = '\0';
s += buff;
return in;
}
}