string(三)-CSDN博客

本文链接：https://blog.csdn.net/yunbao00_/article/details/141904893

可以看到中文的在数组中是无法正常在监视窗口中显示的

字符是通过ascll码存储的那么中文和其他地区的文字又是通过什么存储的？

是通过unicode 也就是万国码可能是由多个字节来确定一个汉字

接下来介绍一下string模版


    	private:
		char* _str;
		size_t _size;
		size_t _capacity;
		const static size_t npos;//静态成员变量不走初始化列表 不能将缺省值放在这里 但是加上const之后就行了 且只能适用于整型

这是string模版的私有成员其中npos是静态成员变量

string(const char* str = "");//写成全缺省 这里不用给构造后会自动给斜杠零
	string::string(const char* str)
		//sizeof是编译时 strlen是运行时去计算长度 
		:_size(strlen(str)) //注意初始化列表的初始化顺序  初始化列表初始化容易出现问题 所以决定使用初始化列表加函数体进行初始化	
	{
		_str = new char[_size+1];//写成方括号不写圆括号是为了和delete对齐
		_capacity = _size;
		strcpy(_str,str);
	}

这里是string的构造这里的初始化列表与代码块一起使用来进行初始化初始化列表的初始化顺序是按照私有成员的创建顺序进行的和这里的顺序无关

这里写成全缺省就不用在写一个构造空string对象的函数了同时缺省值不需要其他写上双引号会自动添加斜杠零

const char* c_str() const;
const char* string:: c_str() const
{
	return _str;
}

这里()括号后的const修饰的成员变量保证成员变量在函数中不会发生改变

void string1()
{
	bit::string s1("hello world");
	cout << s1.string::c_str() << endl;
	
	
}

		size_t size() const;
	size_t string:: size() const
	{
		return _size;
	}

size函数也是使用const修饰函数成员防止在函数体中发生改变

接下来要介绍遍历这里需要[]和迭代器进行访问

这里的iterator 利用的是char*指针 begin和end分别返回字符串数组首元素和有效元素最后一位的下一位 []的参数是下标返回的值的对应数组下标位置中的内容 []不仅可以访问内容也可以进行修改

typedef char* iterator;
iterator begin();
iterator end();		
string::iterator string::begin()
{
	return _str;
}

string::iterator string::end()
{
	return _str + _size;
}

char& operator[](size_t pos);
	char& string:: operator[](size_t pos)
	{
		assert(pos < _size);
		return _str[pos];
	}

遍历的方式有三种 [] 迭代器范围for

void string1()
{
	bit::string s1("hello world");
	cout << s1.string::c_str() << endl;
	for (size_t i = 0; i < s1.size(); i++)
	{
		s1[i]++;
	}
	for (size_t i = 0; i < s1.size(); i++)
	{
		cout << s1[i] << " ";
	}
	cout << endl;
	for (auto e : s1)
	{
		cout << e << " ";
	}
	cout << endl;
	bit::string::iterator it1 = s1.begin();//写成char*也能通过 为什么还要typedef成iterator呢  这其实是第二次封装 通过typedef封装迭代器iterator
	while (it1 != s1.end())//封装：屏蔽了底层实现细节 提供了一种简单通用的访问容器的方式
	{
		cout << *it1 << " ";
		++it1;
	}
	cout << endl;
	bit::string s2;
	cout << s2.string::c_str() << endl;
}

接下来介绍push_back和append push_back是尾插一个字符而append则可以尾插字符串


 void push_back(char ch);

void string:: push_back(char ch)
{
	if (_size == _capacity)
	{
		size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
		reserve(newcapacity);
	}

	_str[_size++] = ch;
	_str[_size] = '\0';
	
}
 void append(const char*str);
void string:: append(const char* str)
{
	
	size_t len = strlen(str);
	if (_size + len > _capacity)
	{
		reserve(len + _size);
	}
	//strcat(_str, str);//strcat会从\0位置开始 进行拼接 并且会和strcpy一样将\0放到末尾
	strcpy(_str+_size, str);//strcpy更合适 直接自己设置拼接位置
	_size += len;
	
}

这里无论push_back还是append都要检查空间是否足够若是不够则需要扩容

扩容则需要用到reserve reserve可以用作扩容修改_capacity

	  void reserve(size_t n);
	void string :: reserve(size_t n)
	{
		if (n > _size)
		{
			char* tmp = new char[n+1];
			strcpy(tmp,_str);
			delete[] _str;

			_str = tmp;
			_capacity = n;
		}
	}

reserve进行的是深拷贝即创立一个更大的空间再将原本空间的内容拷贝到新空间将旧空间释放之后在将_str指正指向新空间将_capacity更新后完成扩容

void string3()
{
	bit::string s5("hello world");
	cout << s5.c_str() << endl;
	s5.push_back('x');
	cout << s5.c_str() << endl;
	s5.append("66666666");
	cout << s5.c_str() << endl;

	s5 += 'z';
	cout << s5.c_str() << endl;
	s5 += "99999";
	cout << s5.c_str() << endl;
}

接下来介绍insert函数 insert可以在有效字符串的内容中任意位置插入字符或者字符串

由于插入内容的不同所以写了两个insert函数

  void insert(size_t pos,char ch);
void string::insert(size_t pos, char ch)
{
	assert(pos <=_size);
	if (_size == _capacity)
	{
		size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
		reserve(newcapacity);
	}
	//int end = _size;
	//while (end >= (int)pos)//这里涉及一个问题 在一个运算符或者操作符的两边 如果类型不一样 会自动隐式类型转换有符号会转换成无符号
	//{//解决方法一 将操作数强转换成整型 
	//	_str[end + 1] = _str[end];
	//	--end;
	//}

	size_t end = _size+1;
	while (end > pos)//这里涉及一个问题 在一个运算符或者操作符的两边 如果类型不一样 会自动隐式类型转换有符号会转换成无符号
	{//解决方法二 改变挪动方法
		_str[end ] = _str[end-1];
		--end;
	}
	_str[pos] = ch;
	_size++;
}

这由于需要插入数据可能空间不够所以需要扩容

而插入位置是任意的所以可能需要挪动字符为插入的内容腾出空间而挪动字符位置的方式有两种

一种是end = _size+1 一种是end = _size 两种都可以挪动字符

	  void insert(size_t pos,const char*str);
void string:: insert(size_t pos, const char* str)
{
	assert(pos <= _size);
	size_t len = strlen(str);
	if (_size + len > _capacity)
	{
		reserve(len + _size);
	}
	/*int end = _size;
	while (end >=(int)pos)
	{
		_str[end + len] = _str[end];
		--end;
	}*/
	size_t end = _size + len;
	while (end >= pos+len)
	{
		_str[end] = _str[end - len];
		--end;
	}
	memcpy(_str+pos,str,len);
	_size += len;

}

这里插入内容也是要判断是否需要扩容的

同时也需要挪动字符串

这里可能会遇到一个问题

while (end > pos)//这里涉及一个问题在一个运算符或者操作符的两边如果类型不一样会自动隐式类型转换有符号会转换成无这样在头插时就会导致循环无法停止需要强转或者保证类型一直

在写完insert之后在实现append和push_back就可以直接使用insert函数进行复用

void string:: push_back(char ch)
{
	/*if (_size == _capacity)
	{
		size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
		reserve(newcapacity);
	}

	_str[_size++] = ch;
	_str[_size] = '\0';*/
	insert(_size,ch);
}
void string:: append(const char* str)
{
	
	//size_t len = strlen(str);
	//if (_size + len > _capacity)
	//{
	//	reserve(len + _size);
	//}
	strcat(_str, str);//strcat会从\0位置开始 进行拼接 并且会和strcpy一样将\0放到末尾
	//strcpy(_str+_size, str);//strcpy更合适 直接自己设置拼接位置
	//_size += len;
	insert(_size,str);
}

void string4()
{
	bit::string s1("hello world");
	cout << s1.c_str() << endl;
	/*s1.insert(6,'x');
	cout << s1.c_str() << endl;*/
	s1.insert(0,'x');
	cout << s1.c_str() << endl;
	s1.insert(0,"11111");
	cout << s1.c_str() << endl;
}

在插入内容之后就介绍erase来删除数据

	  void erase(size_t pos = 0 ,size_t len = npos);
	void string:: erase(size_t pos, size_t len )
	{
		assert(pos < _size);
		if ( pos +len >= _size)
		{
			_str[pos] = '\0';
			_size = pos;
		}
		else
		{
			strcpy(_str + pos, _str + len + pos);
			_size -= len;
		}
		
	}

这里通过assert来判断下标是否合法

对于长度如果从pos开始 len大于剩余有效字符长度那么就全部删除也就是在pos位置修改为斜杠零同时将_size修改为pos

反之就通过strcpy对字符串进行重新拼接之后更新_size

void string5()
{
	bit::string s1("hello world");
	cout << s1.c_str() << endl;
	s1.erase(6,3);
	cout << s1.c_str() << endl;
}

接下来介绍find 如果能够找到就返回对应的下标

 size_t find(char ch,size_t pos = 0);
size_t string:: find(char ch, size_t pos )
{
	for (size_t i = pos;i < _size;i++)
	{
		if (_str[i] == ch)
		{
			return i;
		}
	}
	return npos;
}

 size_t find(const char* sub, size_t pos = 0);
size_t string:: find(const char* sub, size_t pos )
{
	//字符串匹配 这里使用strstr
	const char* p = strstr(_str+pos,sub);//strstr返会指针 用返会位置的指针减去开始位置的指针就等于这个位置的下标
	return p - _str;
}

void string6()
{
	bit::string s1("hello world");
	cout << s1.find('o') << endl;
	cout << s1.find("wor") << endl;
}

这是一个浅拷贝问题解决方法是要设置为深拷贝

void string7()
{
	bit::string s1("hello world");
	bit::string s2(s1);//这里涉及到浅拷贝问题 两个对象公用一片空间  这时存在两个问题 1.会析构两次 2.一个修改 另一个也会改变
	cout << s1.c_str() << endl;
	cout << s2.c_str() << endl;
}

	  string(const string& s);
	string ::string(const string& s)//现代写法（让别人干活交换）
	{
		string tmp(s._str);
		swap(tmp);//这里相当于复用了之前写过的一个成员变量的swap
	}

string ::string(const string& s)//传统写法
{
	_str = new char[s._capacity+1];
	strcpy(_str,s._str);
	_size = s._size;
	_capacity = s._capacity;
}

如果使用库中的swap直接对string进行交换那么效率会特别低所以需要写一个string自己的成员函数swap

这里的swap一次交换一次深拷贝两次赋值一共三次深拷贝代价很大

   	  void swap(string&s);
	void string::swap(string& s)
	{
		//简单方法就是不要直接交换string 而是选择交换指针  
		std::swap(_str,s._str);
		std::swap(_size, s._size);
		std::swap(_capacity, s._capacity);
		//swap一共有三个 std中的 成员函数的 和全局的 其中全局和成员函数是损耗较低的
	}

这里不是用库中的swap直接交换而是通过对string中私有函数成员的进行交换可以减少损耗

我们的=重载也是使用swap进行函数复用的


	string& string::operator=(const string& s)
string& string::operator=(const string& s)
{
	if (this != &s)
	{
		char* tmp = new char[s._capacity + 1];
		strcpy(tmp, s._str);
		delete[] _str;
		_str = tmp;
		_size = s._size;
		_capacity = s._capacity;
	}

	return *this;
}

void string8()
{
	bit::string s1("yyyyy");
	bit::string s2("hello world");

	s1 = s2;
	cout << s1.c_str() << endl;
	cout << s2.c_str() << endl;
}

substr 可以用与分割字符串返回的字符串可以用于赋值string类对象

	  string substr(size_t pos = 0,size_t len = npos);
	string string:: substr(size_t pos, size_t len )//在声明的时候写好默认参数 在定义时就不需要写了 （在声明和定义分离的情况下）
	{
		if (len > _size-pos )
		{
			string sub(_str+pos);
			return sub;

		}
		else
		{
			string sub;
			sub.reserve(len);
			for (size_t i = 0; i < len; i++)
			{
				sub += _str[pos + i];
			}
			return sub;
		}
		
	}

这里是通过创建一个新对象同时通过拷贝构造将内容进入新对象之后返回

void string9()
{
		bit::string url("https://gitee.com/ailiangshilove/cpp-class/blob/master/%E8%AF%BE%E4%BB%B6%E4%BB%A3%E7%A0%81/C++%E8%AF%BE%E4%BB%B6V6/string%E7%9A%84%E6%8E%A5%E5%8F%A3%E6%B5%8B%E8%AF%95%E5%8F%8A%E4%BD%BF%E7%94%A8/TestString.cpp");
		size_t pos1 = url.find(':');
		bit::string url1 = url.substr(0, pos1 - 0);
		cout << url1.c_str() << endl;

		size_t pos2 = url.find('/', pos1 + 3);
		bit::string url2 = url.substr(pos1 + 3, pos2 - (pos1 + 3));
		cout << url2.c_str() << endl;

		bit::string url3 = url.substr(pos2 + 1);
		cout << url3.c_str() << endl;
	
}

通过这个函数可以将网址的区域分开

重载流插入和流提取流插入是通过遍历的方式进行将其打印

流插入由于每次有肯能会进行扩容会造成大损耗所以设置了buff字符数组这里只有当buff数组满了才会+=赋值一次扩容一次这样可以大大减少损耗这里使用get()可以防止在提取空格和斜杠零时防止提取不到这样循环就会一直持续

istream& operator>>(istream &is,string& str);
istream& operator>>(istream& is, string& str)
{
	str.clear();

	char buff[128];
	char ch = is.get();
	int i = 0;
	while (ch != ' ' && ch != '\n')
	{
		buff[i++] = ch;
		if (i == 127)
		{
			buff[i] = '\0';
			str += buff;
			i = 0;
		}
		ch = is.get();
	}
	if (i != 0)
	{
		buff[i] = '\0';
		str += buff;
	}
	return is;
}
ostream& operator << (ostream &os,const string& str);
ostream& operator << (ostream& os, const string& str)
{
	for (size_t i = 0;i<str.size();i++)
	{
		os << str[i];
	}
	return os;
}

void string10()
{
	bit::string s1("hello world");
	cout << s1 << endl;
	cin >> s1;
	cout << s1 << endl;
}