一:回顾
(1)c++中的string类是在面试中和笔试中经常考的题目; 工程代码免费下载 string类的自行实现
(2)c++中的string类和fstream类合起来是处理外部数据的利器;
(3)string类经常用到find find_first_of find_first_not_of find_last_of find_last_not_of substr replace等,以及联合使用来达到java中的split和trim
(4) 使用friend 仅仅是在类中进行声明的非内部 却可以访问内部成员的外部函数,而且在外部不再需要friend关键字;它与成员函数的区别是,friend和外部函数不含有this对象指针;本文用到了const 定义的全局最大值最小值变量(代替#define)
(5) 有些函数返回的是MyString& 、Char& 等(引用),MyString、Char 等(传值)这得看你返回的对象是函数的局部变量还是全局变量(或者类当前对象成员变量);前者只能返回一个MyString、Char 等;后者强烈建议返回MyString& 、Char& 等(引用);
(6)有些函数的参数是const MyString& ,有些是MyString& (引用);这是为什么?前者是把外部值传提到子函数内部,且不允许改变;后者是作为函数的返回值传递进去的,返回的结果为函数的处理结果(而不用函数自身返回值了)。
二:下面是简单的实现了一下string类,参照的是STL源码,但是自己理解的还是不够深,难免有一些错误,请各位指教
(1)MyString.h文件
- #ifndef MYSTRING_H
- #define MYSTRING_H
- #include "MyExcept.h"
- #include <cstring>
- #include <iostream>
- const int INI_MAX = 0x7fffffff;//2^32npos
- const int INI_MIN = 0x80000000;// -2^32
- const int npos = 0xffffffff;// npos
- using namespace std;
- class MyString
- {
- public:
- // constructor
- MyString();//
- MyString(const MyString &);//
- MyString(const char *);
- MyString(const size_t,const char);
- // destructor
- ~MyString();
- // attributes
- size_t length();// 字符串长度
- bool isEmpty();// 返回字符串是否为空
- const char* c_str();// 返回c风格的trr的指针
- // friend funs
- // read writer operations
- friend ostream& operator<< (ostream&, const MyString&);
- friend istream& operator>> (istream&, MyString&);
- //add operation
- friend MyString operator+(const MyString&,const MyString&);
- // compare operations
- friend bool operator==(const MyString&,const MyString&);
- friend bool operator!=(const MyString&,const MyString&);
- friend bool operator<(const MyString&,const MyString&);
- friend bool operator<=(const MyString&,const MyString&);
- friend bool operator>(const MyString&,const MyString&);
- friend bool operator>=(const MyString&,const MyString&);
- // 成员函数实现运算符重载,其实一般需要返回自身对象的,成员函数运算符重载会好一些
- // index operation
- char& operator[](const size_t);
- const char& operator[](const size_t)const;
- // =
- MyString& operator=(const MyString&);
- // +=
- MyString& operator+=(const MyString&);
- // +=
- //MyString operator+=(const MyString&); cannot be overloaded
- // 成员操作函数
- // substr
- MyString substr(size_t pos,const size_t n);
- // append
- MyString& append(const MyString&);
- //insert
- MyString& insert(size_t,const MyString&);
- //assign 替换
- MyString& assign(MyString&,size_t,size_t);
- // erase 删除
- MyString& erase(size_t,size_t);
- //find_first_of 查找某一个字符 size_t 是非符号数的,重载
- // 查找在字符串中第一个与str中的某个字符匹配的字符,返回它的位置。
- //搜索从index开始,如果没找到就返回string::npos
- int find_first_of(const char* str,size_t index=0);
- int find_first_of(const char ch,size_t index=0);
- int find_first_of(const MyString &,size_t index=0);
- // 在字符串中查找第一个与str中的字符都不匹配的字符,返回它的位置。搜索从index开始。如果没找到就返回string::nops
- int find_first_not_of(const char* str,size_t index=0);
- int find_first_not_of(const char ch,size_t index=0);
- int find_first_not_of(const MyString&,size_t index=0);
- // swap
- void swap(MyString& lhs,MyString& rhs);
- // replace_all
- MyString& replace_all(const char oldc,const char newc=NULL);
- MyString& replace(size_t index,size_t num1,size_t num2,const char ch);
- //find
- int find(const char* str,size_t index=0);
- int find(const MyString& str,size_t index=0);
- int find(const char ch,size_t index=0);
- //private
- private:
- char *p_str;
- size_t strLength;
- };
- #endif // MYSTRING_H
(2)MyString.cpp文件
- #include "MyString.h"
- #include <cassert>
- // constructor
- MyString::MyString():p_str(NULL),strLength(0){}
- MyString::MyString(const MyString &str)//
- {
- if(NULL == str.p_str)
- {
- return;
- }
- strLength = str.strLength;
- p_str = new char[strLength+1];
- strcpy(p_str,str.p_str);
- }
- MyString::MyString(const char *str)
- {
- if(NULL == str)
- {
- return;
- }
- strLength = strlen(str);
- p_str = new char[strLength+1];
- strcpy(p_str,str);
- }
- MyString::MyString(const size_t len,const char ch)
- {
- if(NULL == ch)
- {
- return;
- }
- strLength = len;
- p_str = new char[strLength+1];
- for(size_t i=0;i<strLength;i++)
- {
- p_str[i] = ch;
- }
- p_str[strLength] = '\0';// 因为strset以'\0'结束的
- cout << p_str << " &&" << endl;
- //strset(p_str,ch);
- //cout << p_str[0] << ",,,"<<strlen(p_str) << "," << strLength << endl;
- }
- // destructor
- MyString::~MyString()
- {
- delete[] p_str;
- }
- // attributes
- size_t MyString::length()// 字符串长度
- {
- return strLength;
- }
- bool MyString::isEmpty()// 返回字符串是否为空
- {
- return strLength==0?true:false;
- }
- const char* MyString::c_str()
- {
- return p_str;
- }
- // 为什么不是引用呢??? friend 使用在类里面进行声明的,外面就不需要了,而且友元函数不属于类的成员函数,所以不用MyString::
- // ostream
- ostream& operator<< (ostream& out,const MyString &str)
- {
- if(str.p_str != NULL)
- {
- out << str.p_str;
- }
- return out;
- }
- // istream,一个是const另一个不是,根据变还是不变
- istream& operator>> (istream& in, MyString& str)
- {
- char tmp[100];// 临时字符串
- if(in>>tmp)
- {
- delete[] str.p_str;
- str.strLength = strlen(tmp);
- str.p_str = new char[str.strLength+1];
- strcpy(str.p_str,tmp);
- }
- return in;
- }
- // + 加
- MyString operator+(const MyString& lhs,const MyString& rhs)
- {
- MyString ret;
- ret.strLength = lhs.strLength + rhs.strLength;
- ret.p_str = new char[ret.strLength+1];
- strcpy(ret.p_str,lhs.p_str);
- strcat(ret.p_str,rhs.p_str);
- return ret;
- }
- // compare operations
- bool operator==(const MyString& lhs,const MyString& rhs)
- {
- return strcmp(lhs.p_str,rhs.p_str)==0?true:false;
- }
- bool operator!=(const MyString& lhs,const MyString& rhs)
- {
- return strcmp(lhs.p_str,rhs.p_str)!=0?true:false;
- }
- bool operator<(const MyString& lhs,const MyString& rhs)
- {
- return strcmp(lhs.p_str,rhs.p_str)<0?true:false;
- }
- bool operator<=(const MyString& lhs,const MyString& rhs)
- {
- return strcmp(lhs.p_str,rhs.p_str)<=0?true:false;
- }
- bool operator>(const MyString& lhs,const MyString& rhs)
- {
- return strcmp(lhs.p_str,rhs.p_str)>0?true:false;
- }
- bool operator>=(const MyString& lhs,const MyString& rhs)
- {
- return strcmp(lhs.p_str,rhs.p_str)>=0?true:false;
- }
- // 成员函数实现运算符重载
- // index operation
- char& MyString::operator[](const size_t index)
- {
- if(index<0 || index>=strLength)
- {
- throw Outofbond() ;
- }
- return p_str[index];
- }
- const char& MyString::operator[](const size_t index)const
- {
- if(index<0 || index>=strLength)
- {
- throw Outofbond();
- }
- return p_str[index];
- }
- // = 赋值构造函数(判断是否是自身) 为什么要这样删除呢?
- MyString& MyString::operator=(const MyString& other)
- {
- if(this != &other)
- {
- if(strLength<other.strLength)
- {
- delete[] p_str;
- p_str = new char[other.strLength+1];
- }
- strLength = other.strLength;
- strcpy(p_str,other.p_str);
- }// 这样可能会产生多余的未释放的空间
- return *this;
- }
- // += 相当于返回的是备份的,内部对象的销毁,不影响的 和 下面的完全不一样的
- // MyString MyString::operator+=(const MyString& other)
- // {
- // if(NULL == other.p_str)
- // {
- // return *this;
- // }
- // MyString ret;
- // ret.strLength = strLength + other.strLength;
- // ret.p_str = new char[ret.strLength+1];
- // strcpy(ret.p_str,p_str);
- // strcat(ret.p_str,other.p_str);
- // return ret;
- // }
- // 返回的是当前对象的引用,当前对象就在调用函数里,所以不会销毁的
- // 判断一下是否是自身相加
- MyString& MyString::operator+=(const MyString& other)
- {
- if(NULL == other.p_str)
- {
- return *this;
- }
- if(this == &other)
- {
- MyString copy(*this);
- return *this += copy;
- }// 必须判断是否相等的,而且要+=的,这样相当于调用了自身,但是这次直接下面去了,不进入if的
- strLength += other.strLength;
- //strLength *= 2;
- char *p_old = p_str;
- p_str = new char[strLength+1];
- strcpy(p_str,p_old);
- strcat(p_str,other.p_str);
- delete[] p_old;// 删除旧的空间
- return *this;
- }
- // 成员操作函数
- // substr 返回应用是不行的,错误的;取从pos开始的n个字符组成的子串
- //MyString& MyString::substr(size_t pos,const size_t n)
- MyString MyString::substr(size_t pos,const size_t n)
- {
- if((pos+n)>=strLength)
- {
- throw Outofbond();
- }
- MyString ret;
- ret.strLength = n;
- //ret.p_str = new char[n+1];
- ret.p_str = new char[ret.strLength+1]; //也可以
- for(size_t i=0;i<n;i++)
- {
- ret.p_str[i] = p_str[pos+i];
- }
- ret.p_str[n] = '\0';
- // for(size_t i=0;i<ret.strLength;i++)
- // {
- // ret[i] = (*this)[pos+i];
- // cout << ret[i] << ",,";
- // }// 也行的,利用刚刚重载的【】,这样更好,不用再次判断越界了,不知道为什么,报错误的
- // ret[ret.strLength] = '\0';
- return ret;
- }
- // append 同 += 追加到末尾
- MyString& MyString::append(const MyString& other)
- {
- *this += other;// 利用刚刚那重载的+=
- return *this;
- }
- //insert 从pos开始的插入other
- MyString& MyString::insert(size_t pos,const MyString& other)
- {
- if(pos<0 || pos>=strLength)
- {
- throw Outofbond();
- }
- char *p_old = p_str;
- strLength += other.strLength;
- p_str = new char[strLength+1];
- for(size_t i=0;i<pos;i++)
- {
- *(p_str+i) = *(p_old+i);
- }
- for(size_t i=pos;i<other.strLength+pos;i++)
- {
- *(p_str+i) = other.p_str[i-pos];
- }
- for(size_t i=other.strLength+pos;i<strLength;i++)
- {
- *(p_str+i) = p_old[i-other.strLength];
- }
- *(p_str+strLength) = '\0';
- return *this;
- }
- //assign 替换 用other的POS开始的n对应替换this的pos开始的
- MyString& MyString::assign(MyString&other,size_t pos,size_t n)
- {
- // if(pos<0 || pos>=strLength)
- // {
- // throw Outofbond();
- // }
- assert(pos>0 && pos<strLength);// assert 的好处
- assert(pos+n<other.strLength);
- if(strLength < pos + n)
- {
- char *p_old = p_str;
- strLength = pos + n;
- p_str = new char[strLength+1];
- for(size_t i=0;i<pos;i++)
- {
- *(p_str+i) = *(p_old+i);
- }
- delete[] p_old;
- }
- for(size_t i=pos;i<pos+n;i++)
- {
- *(p_str+i) = other.p_str[i];
- }
- *(p_str+pos+n) = '\0';
- return *this;
- }
- // erase 删除 这个方法并不是很好的,并没有释放所erase的空间,请看下面的
- // MyString& MyString::erase(size_t pos,size_t n)
- // {
- // if((pos+n)>strLength)
- // {
- // throw Outofbond();
- // }
- // size_t index = pos + n;
- // while(*(p_str+index)!='\0')
- // {
- // *(p_str+index-n) = *(p_str+index);
- // ++index;
- // }
- // *(p_str+index-n) = '\0';
- // return *this;
- // }
- // erase 删除 从pos开始的n个字符
- MyString& MyString::erase(size_t pos,size_t n)
- {
- if((pos+n)>strLength)
- {
- throw Outofbond();
- }
- char *p_old = p_str;
- strLength -= n;
- p_str = new char[strLength+1];
- for(size_t i=0;i<pos;i++)
- {
- p_str[i] = p_old[i];
- }
- for(size_t i=pos;i<strLength;i++)
- {
- p_str[i] = p_old[i+n];
- }
- *(p_str+strLength) = '\0';
- return *this;
- }
- //find_first_of 查找某一个字符 size_t 是非符号数的
- // 查找在字符串中第一个与str中的某个字符匹配的字符,返回它的位置。
- //搜索从index开始,如果没找到就返回string::npos
- int MyString::find_first_of(const char* str,size_t index)
- {
- if(NULL == str || index >=strLength)
- return npos;
- int tmp_len = strlen(str),j;
- size_t flag,min_index = INI_MAX;
- for(j=0;j<tmp_len;j++)
- {
- flag = npos;
- for(size_t i=index;i<strLength;i++)
- {
- if(str[j] == p_str[i])
- {
- flag = i;
- break;
- }
- }
- // indexs[j] = flag;
- if(flag != npos)
- {
- min_index = min_index<flag?min_index:flag;
- }
- }
- // for(j=0;j<tmp_len;j++)
- // {
- // if(indexs[j]!=npos)
- // min = min<indexs[j]?min:indexs[j];
- // }
- if(min_index == INI_MAX)
- {
- return npos;
- // min_index = npos;
- // cout << "---npos----" << min_index << ",,,,";
- }
- return min_index;
- }
- int MyString::find_first_of(const char ch,size_t index)
- {
- if(NULL == ch || index >=strLength)
- return npos;
- int j;
- size_t flag = npos;
- for(size_t i=index;i<strLength;i++)
- {
- if(ch == p_str[i])
- {
- flag = i;
- break;
- }
- }
- return flag;
- }
- int MyString::find_first_of(const MyString& str,size_t index)
- {
- if(NULL == str || index >=strLength)
- return npos;
- int j;
- size_t flag,min_index = INI_MAX;
- for(j=0;j<str.strLength;j++)
- {
- flag = npos;
- for(size_t i=index;i<strLength;i++)
- {
- if(str[j] == p_str[i])
- {
- flag = i;
- break;
- }
- }
- if(flag != npos)
- {
- min_index = min_index<flag?min_index:flag;
- }
- }
- if(min_index == INI_MAX)
- {
- return npos;
- }
- return min_index;
- }
- // 在字符串中查找第一个与str中的字符都不匹配的字符,返回它的位置。
- //搜索从index开始。如果没找到就返回string::nops O(N^2)
- int MyString::find_first_not_of(const char *str,size_t index)
- {
- if(NULL == str || index >=strLength)
- return npos;
- size_t i=0,j=0;
- size_t tmp_len = strlen(str);
- for(i=index;i<strLength;i++)
- {
- for(;j<tmp_len;j++)
- {
- if(p_str[i]==str[j])
- break;
- }
- if(j==tmp_len)
- break;// 根据跳出的内层for的条件判断,找到即结束循环
- }
- if(i==strLength)
- return npos;// 未找到,// 根据跳出的内层for的条件判断,找到即结束循环
- return i;
- }
- int MyString::find_first_not_of(const MyString& str,size_t index)
- {
- if(NULL == str || index >=strLength)
- return npos;
- size_t i=0,j=0;
- for(i=index;i<strLength;i++)
- {
- for(;j<str.strLength;j++)
- {
- if(p_str[i]==str[j])
- break;// 如果相等 本轮i就无效了,进行下一轮
- }
- if(j==str.strLength)
- break;// 根据跳出的内层for的条件判断,找到即结束循环
- }
- if(i==strLength)
- return npos;// 未找到,// 根据跳出的内层for的条件判断,找到即结束循环
- return i;
- }
- int MyString::find_first_not_of(const char ch,size_t index)
- {
- if(NULL == ch || index >=strLength)
- return npos;
- size_t i=0;
- for(i=index;i<strLength;i++)
- {
- if(p_str[i]!=ch)// 跟上面的略微不同,找一个不等就可以了
- break;
- }
- if(i==strLength)
- return npos;// 未找到,// 根据跳出的内层for的条件判断,找到即结束循环
- return i;
- }
- // swap 都得变得,所以非const
- void MyString::swap(MyString& lhs,MyString& rhs)
- {
- lhs.strLength ^= rhs.strLength;
- rhs.strLength ^= lhs.strLength;
- lhs.strLength ^= rhs.strLength;
- char *p_tmp = rhs.p_str;
- rhs.p_str = lhs.p_str;
- lhs.p_str = p_tmp;
- }
- // replace_all 这个东西还是不太好弄的啊,不是很理想
- MyString& MyString::replace_all(const char oldc,const char newc)
- {
- if(NULL == oldc)
- {
- return *(this);
- }
- for(size_t i=0;i<strLength;i++)
- {
- if(p_str[i] == oldc)
- {
- p_str[i] = newc;
- }
- }
- return *(this);
- }
- MyString& MyString::replace(size_t index,size_t num1,size_t num2,const char ch)
- {
- }
- // find 函数
- int MyString::find(const char* str,size_t index)
- {
- assert(str!=NULL&&index<strLength);
- // kmp 中的getnext函数
- size_t len = strlen(str);
- size_t next[len+1];
- size_t j,k;
- next[0] = npos;
- j = 0;
- k = npos;
- while(j<len)
- {
- if(k==npos || str[j]==str[k])
- {
- j++;
- k++;
- next[j] = k;
- }
- else
- k = next[k];
- }
- // kmp 算法
- k = index;
- j = 0;
- while(p_str[k]!='\0')
- {
- if(j==0 || p_str[k]==str[j])
- {
- k++;
- j++;
- }
- else
- {
- j = next[j];// 消除指针回溯
- }
- if(str[j] == '\0')//匹配成功
- return k-j;
- }
- return npos;
- }
- int MyString::find(const MyString& str,size_t index)
- {
- // if(this == &str)
- // {
- // MyString other(*this);
- // find(other,index);
- // }
- assert(NULL!=str && index<strLength);
- // kmp 中的getnext函数
- size_t next[str.strLength+2];
- size_t j,k;
- next[0] = npos;
- j = 0;
- k = npos;
- while(j<str.strLength)
- {
- if(k==npos || str.p_str[j]==str.p_str[k])
- {
- j++;
- k++;
- next[j] = k;
- }
- else
- k = next[k];
- }
- int i;
- for(i=1;i<=j;i++)
- cout << next[i] << ",";
- // kmp 算法
- k = index;
- j = 0;
- while(p_str[k]!='\0')
- {
- if(j==0 || p_str[k]==str.p_str[j])
- {
- k++;
- j++;
- }
- else
- {
- j = next[j];// 消除指针回溯
- }
- if(str.p_str[j] == '\0')//匹配成功,不知道为什么调用自身的str[]重载总是报错的
- return k-j;
- }
- if(str.p_str[j] == '\0')// 同一个字符串
- return k-j;
- return npos;
- }
- int MyString::find(const char ch,size_t index)
- {
- assert(NULL!=ch && index<strLength);
- for(size_t i=index;i<strLength;i++)
- {
- if(p_str[i] == ch)
- return i;
- }
- return npos;
- }
- #include "MyString.h"
- #include <iostream>
- using namespace std;
- int main()
- {
- int n;
- int choose = 1;
- int p,l;
- char cs[100];
- MyString s1;
- MyString s2("hello");
- MyString s3 = "HELLO";
- cout << "***** welcome *****\n";
- cout << "******* MADE BY zyp **********\n";
- cout << "s1= " << s1 << "s2= " << s2 << "s3= " << s3 << endl;
- cout << "请输入一个长度小于100的字符串:例如world\n";
- cin >> s1;
- s1 = s1;
- //s1 = s1+s1;
- s1 += s1;
- MyString s4(s1);
- s4.append(s1);
- s2.insert(2,s3);
- s1.erase(4,4);
- s1.assign(s2,1,7);
- cout << "s1= " << s1 << "s2= " << s2 << "s3= " << s3 << "s4= " << s4 << endl;
- s2 = s4.substr(2,7);
- cout << "s4[3]= " << s4[3] << s4.length() << (s1>=s2) << "s4.substr() " << s2 << endl;
- cout << "s1.find_first_of(beLE,2):" << s1.find_first_of("beLE",2) << ",s1.find_first_of(a,3):" << s1.find_first_of('a',3) << ",s1.find_first_of(s3,2):" << s1.find_first_of(s3,2) << endl;
- MyString s5(5,'b');
- s5 += s5;
- //s5.append(s5);// 不知道为什就是不能append
- cout << "s5 = " << s5 << "s5.find_first_not_of(aeHLEOl,2):" << s5.find_first_not_of("aeHLEOl",2) << "s5.find_first_not_of(aeHLEOl,0):" << s5.find_first_not_of("aeHLEOl") << endl;
- cout << "s5.find_first_not_of(s1,2):" << s5.find_first_not_of(s1,2) << "s5.find_first_not_of(b,2):" << s5.find_first_not_of('b',2) << endl;
- swap(s1,s5);
- s5.replace_all('a','J');
- MyString s6("LLO");
- cout << s1 << "," << s5 << "s5.find(LLO,0) " << s5.find("LLO",0) << "s5.find(s6,0) " << s5.find(s5) << endl;
- cout << npos << endl;
- return 0;
- }
三:感悟
(1)耗时将近2天的实现了它,自己与其从中学到了很多,倒不如说是重新认识了string类;
(2)自己知道这个简单的string类,距离string源代码还差的很远很远;但是它帮助我更好的理解了string类,至少会简单的应用了。
(3)简单的实现了一下string类,参照的是STL源码,但是自己理解的还是不够深,难免有一些错误,请各位指教,万分感谢!
(4)下一步进军list