一、string类主要的函数接口
模拟实现string类,主要就是实现string类中的一个个函数接口,我们来看看标准库中的string类中共有多少种函数接口。
这些就是string类的接口,我们在实现string类时,为了避免与标准库中的string类发生冲突,所以我们模拟实现的类要放在自己定义的命名空间内。
下面我们来看下我们要实现的接口:
#define _CRT_SECURE_NO_WARNINGS 1
#pragma once
#include<iostream>
#include<string>
#include<assert.h>
using namespace std;
namespace bit
{
class string
{
public:
typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
string(const char* str = "")
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity + 1];
strcpy(_str, str);
}
string(const string& s)
{
_str = new char[s._capacity + 1];
strcpy(_str, s._str);
_size = s._size;
_capacity = s._capacity;
}
string& operator=(const string& s)
{
if (this != &s)
{
delete[] _str;
_str = new char[s._capacity + 1];
strcpy(_str, s._str);
_size = s._size;
_capacity = s._capacity;
}
return *this;
}
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
const char* c_str() const
{
return _str;
}
void clear()
{
_str[0] = '\0';
_size = 0;
}
size_t size() const
{
return _size;
}
size_t capacity() const
{
return _capacity;
}
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
const char& operator[](size_t pos) const
{
assert(pos < _size);
return _str[pos];
}
void reserve(size_t n);
void push_back(char ch);
void append(const char* str);
string& operator+=(char ch);
string& operator+=(const char* str);
void insert(size_t pos, char ch);
void insert(size_t pos, const char* str);
void erase(size_t pos, size_t len = npos);
size_t find(char ch, size_t pos = 0);
size_t find(const char* str, size_t pos = 0);
string substr(size_t pos = 0, size_t len = npos);
private:
char* _str;
size_t _size;
size_t _capacity;
static const size_t npos;
};
bool operator<(const string& s1, const string& s2);
bool operator<=(const string& s1, const string& s2);
bool operator>(const string& s1, const string& s2);
bool operator>=(const string& s1, const string& s2);
bool operator==(const string& s1, const string& s2);
bool operator!=(const string& s1, const string& s2);
ostream& operator<<(ostream& out, const string& s);
istream& operator>>(istream& in, string& s);
}
二、string类的模拟实现
2.1 迭代器的模拟实现
迭代器主要就是返回string的首尾位置。
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
begin就返回字符串首元素的位置,end返回_str+_size就是最后一个元素的位置。
2.2 string构造函数、拷贝构造函数和析构函数的模拟实现
构造函数:
string(const char* str = "")
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity + 1];
strcpy(_str, str);
}
在初始化时,我们将字符串初始化为空指针,可以将其初始化为"",而且这里要注意的是,我们使用new开空间时每次都要多开一个字节用于存放'\0',但_capacity不包括'\0',最后再使用strcpy将字符串拷贝给_str。
拷贝构造函数:
string(const string& s)
{
_str = new char[s._capacity + 1];
strcpy(_str, s._str);
_size = s._size;
_capacity = s._capacity;
}
与构造函数类似,先开空间,再将字符串拷贝给_str,最后再给_size和_capacity赋值即可。
析构函数:
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
将所开的空间释放掉,最后将_str置为空,_size和_capacity置为0即可。
2.3 运算符重载的模拟实现
赋值重载:
string& operator=(const string& s)
{
if (this != &s)
{
delete[] _str;
_str = new char[s._capacity + 1];
strcpy(_str, s._str);
_size = s._size;
_capacity = s._capacity;
}
return *this;
}
首先先判断两个字符串是否相同,如果是自己给自己赋值,直接返回即可,没必要在进行拷贝等操作,如果不同,就先将_str的空间释放掉,因为字符串的长度可能不同,接下来就是开空间和拷贝了。
[]重载:
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
const char& operator[](size_t pos) const
{
assert(pos < _size);
return _str[pos];
}
[]重载就是通过下标来访问字符串,也可以通过下标来修改字符串。
+=重载:
string& string::operator+=(char ch)
{
push_back(ch);
return *this;
}
string& string::operator+=(const char* str)
{
append(str);
return *this;
}
+=就是进行尾插,可以尾插一个字符,也可以尾插一个字符串,在实现这两个功能时,我们可以复用push_back和append,这两个接口在下面会讲到。
>>重载:
istream& operator>>(istream& in, string& s)
{
s.clear();
const int N = 256;
char buff[N];
int i = 0;
char ch;;
ch = in.get();
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == N - 1)
{
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
if (i > 0)
{
buff[i] = '\0';
s += buff;
}
return in;
}
>>重载就是输入字符串,在输入字符串前先将原有的字符串清除,因为输入的字符串可能会很长,这时就需要不断地扩容,为了减少扩容,我们可以创建一个临时数组buff,当buff存满时我们在尾插到字符串上,这样就可以减少扩容的次数。
>>重载需要注意的是,当我们输入的字符为' '和'\n'时,便会停止读入字符。
<<重载:
ostream& operator<<(ostream& out, const string& s)
{
for (auto ch : s)
{
out << ch;
}
return out;
}
<<重载就是输出,我们只需用范围for遍历输出字符串的每个字符即可。
2.4 关系运算符重载的模拟实现
关系运算符重载就是判断字符串的大小关系,我们只需要实现<和==的关系即可,其他关系的实现可以复用这两个逻辑。
bool bit::operator<(const string& s1, const string& s2)
{
return strcmp(s1.c_str(), s2.c_str()) < 0;
}
bool bit::operator<=(const string& s1, const string& s2)
{
return s1 < s2 || s1 == s2;
}
bool bit::operator>(const string& s1, const string& s2)
{
return !(s1 <= s2);
}
bool bit::operator>=(const string& s1, const string& s2)
{
return !(s1 < s2);
}
bool bit::operator==(const string& s1, const string& s2)
{
return strcmp(s1.c_str(), s2.c_str()) == 0;
}
bool bit::operator!=(const string& s1, const string& s2)
{
return !(s1 == s2);
}
库中写了类和类、类和字符串、字符串和类比较,我们只写了类和类比较但也能完成字符串和类比较是因为隐式类型转换,当字符串与类类型比较时,内置类型能隐式转换为类类型,就可完成比较。
2.5 扩容的模拟实现
void string::reserve(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
如果要求扩容的空间小于_capacity,不扩容,否则就扩容要求扩容的空间再加1,多的1个空间用于存放'\0',最后便是拷贝给给原来的字符串,在拷贝之前要将原空间先释放掉。
2.6 尾插的模拟实现
尾插一个字符:
void string::push_back(char ch)
{
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;
++_size;
_str[_size] = '\0';
}
string& string::operator+=(char ch)
{
push_back(ch);
return *this;
}
在尾插时,要注意容量,当容量超出时要扩容,尾插就利用下标实现是比较方便的,我们将_str[size]的值赋为ch,再将后一位赋为'\0'。
尾插一个字符串:
void string::append(const char* str)
{
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
}
strcpy(_str + _size, str);
_size += len;
}
string& string::operator+=(const char* str)
{
append(str);
return *this;
}
尾插一个字符串用下标实现就不方便了,我们直接找到原字符串的末尾位置,再将要插入的字符串拷贝到原字符串的末尾即可。
2.7 插入的模拟实现
在pos位置前插入一个字符:
void string::insert(size_t pos, char ch)
{
assert(pos <= _size);
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
size_t end = _size + 1;
while (end > pos)
{
_str[end] = _str[end - 1];
--end;
}
_str[pos] = ch;
++_size;
}
先检测容量,不够就扩容,再将pos及pos之后的位置往后挪一位,最后通过下标将要插入的字符放入pos位置。
在pos位置前插入一个字符串:
void string::insert(size_t pos, const char* s)
{
assert(pos <= _size);
size_t len = strlen(s);
if (_size + len > _capacity)
{
reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
}
size_t end = _size + len;
while (end > pos + len - 1)
{
_str[end] = _str[end - len];
--end;
}
for (size_t i = 0; i < len; i++)
{
_str[pos + i] = s[i];
}
_size += len;
}
插入一个字符串,我们不能像之前尾插那样直接使用strcpy进行拷贝,因为strcpy会将'\0'也拷贝进去,所以我们还是利用下标来实现。先检测容量,不够进行扩容,再将pos及pos后所有字符后移len个位置,再将要插入的字符串的每个字符一次插入。
2.8 删除的模拟实现
在string
类里面声明函数时可以给一个缺省值npos
,如果函数调用时只给一个实参则默认pos
位置后面的内容全部删除。
void erase(size_t pos, size_t len = npos);
在删除时我们需要判断len的长度,len大于_size-pos就将pos后的位置全部进行删除,否则就只删除len个字符。
void string::erase(size_t pos, size_t len)
{
assert(pos < _size);
if (len >= _size - pos)
{
_str[pos] = '\0';
_size = pos;
}
else
{
for (size_t i = pos + len; i <= _size; i++)
{
_str[i - len] = _str[i];
}
_size -= len;
}
}
如果len大于_size-pos我们只需将pos位置的字符改为'\0'即可,否则就将删除位置之后的字符依次前移。
2.9 查找的模拟实现
查找字符:
size_t string::find(char ch, size_t pos)
{
assert(pos < _size);
for (size_t i = pos; i < _size; i++)
{
if (_str[i] == ch)
{
return i;
}
}
return npos;
}
只传一个实参时,默认从第一位开始查找,传pos时便从pos位置开始查找,遍历一遍,找到相同字符就返回该位置的下标,没找到便返回npos。
查找字符串:
size_t string::find(const char* str, size_t pos)
{
assert(pos < _size);
const char* ptr = strstr(_str + pos, str);
if (ptr == nullptr)
{
return npos;
}
else
{
return ptr - _str;
}
}
只传一个实参时,也是默认从第一位开始向后找,我们可以通过strstr来实现这个功能,strstr第一个参数应该是_str+pos,因为是从pos位置开始查找,没找到strstr返回的是空指针,如果是空指针就返回npos,否则返回ptr-_str,因为find返回的是下标而不是指针,ptr-_str便是字符串开头的下标。
2.10 返回字串的模拟实现
string string::substr(size_t pos, size_t len)
{
assert(pos < _size);
if (len > _size - pos)
{
len = _size - pos;
}
string sub;
sub.reserve(len);
for (size_t i = 0; i < len; i++)
{
sub += _str[pos + i];
}
return sub;
}
只传一个实参时,也是默认从第一位开始向后找,我们可以用reserve先提前开好len个空间,再将要返回的字串的每一个字符依次尾插到一个临时字符串sub,最后返回sub。
三、模拟实现string完整代码
string.h文件:
#define _CRT_SECURE_NO_WARNINGS 1
#pragma once
#include<iostream>
#include<string>
#include<assert.h>
using namespace std;
namespace bit
{
class string
{
public:
typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
string(const char* str = "")
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity + 1];
strcpy(_str, str);
}
string(const string& s)
{
_str = new char[s._capacity + 1];
strcpy(_str, s._str);
_size = s._size;
_capacity = s._capacity;
}
string& operator=(const string& s)
{
if (this != &s)
{
delete[] _str;
_str = new char[s._capacity + 1];
strcpy(_str, s._str);
_size = s._size;
_capacity = s._capacity;
}
return *this;
}
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
const char* c_str() const
{
return _str;
}
void clear()
{
_str[0] = '\0';
_size = 0;
}
size_t size() const
{
return _size;
}
size_t capacity() const
{
return _capacity;
}
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
const char& operator[](size_t pos) const
{
assert(pos < _size);
return _str[pos];
}
void reserve(size_t n);
void push_back(char ch);
void append(const char* str);
string& operator+=(char ch);
string& operator+=(const char* str);
void insert(size_t pos, char ch);
void insert(size_t pos, const char* str);
void erase(size_t pos, size_t len = npos);
size_t find(char ch, size_t pos = 0);
size_t find(const char* str, size_t pos = 0);
string substr(size_t pos = 0, size_t len = npos);
private:
char* _str;
size_t _size;
size_t _capacity;
static const size_t npos;
};
bool operator<(const string& s1, const string& s2);
bool operator<=(const string& s1, const string& s2);
bool operator>(const string& s1, const string& s2);
bool operator>=(const string& s1, const string& s2);
bool operator==(const string& s1, const string& s2);
bool operator!=(const string& s1, const string& s2);
ostream& operator<<(ostream& out, const string& s);
istream& operator>>(istream& in, string& s);
}
string.cpp文件:
#include"string.h"
namespace bit
{
const size_t string::npos = -1;
void string::reserve(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
void string::push_back(char ch)
{
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;
++_size;
_str[_size] = '\0';
}
string& string::operator+=(char ch)
{
push_back(ch);
return *this;
}
void string::append(const char* str)
{
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
}
strcpy(_str + _size, str);
_size += len;
}
string& string::operator+=(const char* str)
{
append(str);
return *this;
}
void string::insert(size_t pos, char ch)
{
assert(pos <= _size);
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
size_t end = _size + 1;
while (end > pos)
{
_str[end] = _str[end - 1];
--end;
}
_str[pos] = ch;
++_size;
}
void string::insert(size_t pos, const char* s)
{
assert(pos <= _size);
size_t len = strlen(s);
if (_size + len > _capacity)
{
reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
}
size_t end = _size + len;
while (end > pos + len - 1)
{
_str[end] = _str[end - len];
--end;
}
for (size_t i = 0; i < len; i++)
{
_str[pos + i] = s[i];
}
_size += len;
}
void string::erase(size_t pos, size_t len)
{
assert(pos < _size);
if (len >= _size - pos)
{
_str[pos] = '\0';
_size = pos;
}
else
{
for (size_t i = pos + len; i <= _size; i++)
{
_str[i - len] = _str[i];
}
_size -= len;
}
}
size_t string::find(char ch, size_t pos)
{
assert(pos < _size);
for (size_t i = pos; i < _size; i++)
{
if (_str[i] == ch)
{
return i;
}
}
return npos;
}
size_t string::find(const char* str, size_t pos)
{
assert(pos < _size);
const char* ptr = strstr(_str + pos, str);
if (ptr == nullptr)
{
return npos;
}
else
{
return ptr - _str;
}
}
string string::substr(size_t pos, size_t len)
{
assert(pos < _size);
if (len > _size - pos)
{
len = _size - pos;
}
string sub;
sub.reserve(len);
for (size_t i = 0; i < len; i++)
{
sub += _str[pos + i];
}
return sub;
}
bool bit::operator<(const string& s1, const string& s2)
{
return strcmp(s1.c_str(), s2.c_str()) < 0;
}
bool bit::operator<=(const string& s1, const string& s2)
{
return s1 < s2 || s1 == s2;
}
bool bit::operator>(const string& s1, const string& s2)
{
return !(s1 <= s2);
}
bool bit::operator>=(const string& s1, const string& s2)
{
return !(s1 < s2);
}
bool bit::operator==(const string& s1, const string& s2)
{
return strcmp(s1.c_str(), s2.c_str()) == 0;
}
bool bit::operator!=(const string& s1, const string& s2)
{
return !(s1 == s2);
}
ostream& operator<<(ostream& out, const string& s)
{
for (auto ch : s)
{
out << ch;
}
return out;
}
istream& operator>>(istream& in, string& s)
{
s.clear();
const int N = 256;
char buff[N];
int i = 0;
char ch;;
ch = in.get();
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == N - 1)
{
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
if (i > 0)
{
buff[i] = '\0';
s += buff;
}
return in;
}
}
test.cpp文件:
#define _CRT_SECURE_NO_WARNINGS 1
#include<iostream>
using namespace std;
#include"string.h"
namespace bit
{
void test_string1()
{
string s1("haha");
string s2("hello world");
cout << s1.c_str() << endl;
cout << s2.c_str() << endl;
for (size_t i = 0; i < s2.size(); i++)
{
s2[i] += 2;
}
cout << s2.c_str() << endl;
for (auto e : s2)
{
cout << e << " ";
}
cout << endl;
string::iterator it = s2.begin();
while (it != s2.end())
{
//*it += 2;
cout << *it << " ";
++it;
}
cout << endl;
}
void test_string2()
{
string s1("hello world");
s1 += 'x';
s1 += '#';
cout << s1.c_str() << endl;
s1 += "hello bit";
cout << s1.c_str() << endl;
s1.insert(5, '$');
cout << s1.c_str() << endl;
s1.insert(0, '$');
cout << s1.c_str() << endl;
string s2("hello world");
cout << s2.c_str() << endl;
s2.insert(5, "$$$");
cout << s2.c_str() << endl;
}
void test_string3()
{
string s1("hello world");
s1.erase(6, 100);
cout << s1.c_str() << endl;
string s3("hello world");
s3.erase(6, 3);
cout << s3.c_str() << endl;
}
void test_string4()
{
string s("test.cpp.zip");
size_t pos = s.find('.');
string suffix = s.substr(pos);
cout << suffix.c_str() << endl;
string copy(s);
cout << copy.c_str() << endl;
s = suffix;
cout << suffix.c_str() << endl;
cout << s.c_str() << endl;
s = s;
cout << s.c_str() << endl;
}
void test_string5()
{
string s1("hello world");
string s2("hello world");
cout << s1 << " " << s2 << endl;
cout << (s1 < s2) << endl;
cout << (s1 <= s2) << endl;
cout << (s1 > s2) << endl;
cout << (s1 >= s2) << endl;
cout << (s1 == s2) << endl;
cout << (s1 != s2) << endl;
string s0;
cin >> s0;
cout << s0 << endl;
}
}
int main()
{
//bit::test_string1();
//bit::test_string2();
//bit::test_string3();
bit::test_string4();
//bit::test_string5();
return 0;
}
四、总结
以上解释string类大部分接口而得模拟实现了,如果以上所讲对大家有所帮助,记得一键三连,感谢各位。