<script type="text/javascript"> </script>
0 前言: string 的角色C++ 语言是个十分优秀的语言,但优秀并不表示完美。还是有许多人不愿意使用C或者C++,为什么?原因众多,其中之一就是C/C++的文本处理功能太麻烦,用 起来很不方便。以前没有接触过其他语言时,每当别人这么说,我总是不屑一顾,认为他们根本就没有领会C++的精华,或者不太懂C++,现在我接触 perl, php, 和Shell脚本以后,开始理解了以前为什么有人说C++文本处理不方便了。举例来说,如果文本格式是:用户名 电话号码,文件名name.txt Tom 23245332Jenny 22231231Heny 22183942Tom 23245332... 那么在shell 编程 中,可以这样用: awk '{print $1} ' name.txt | sort | uniq 如果使用C/C++ 就麻烦了,他需要做以下工作:
当然,有了STL,这些处理会得到很大的简化。我们可以使用 fstream来代替麻烦的fopen fread fclose, 用vector 来代替数组。最重要的是用 string 来代替char * 数组,使用sort排序算法 来排序,用unique 函数 来去重。听起来好像很不错 。看看下面代码(例程1): #include<string>
当然,在这个文本格式中,不用vector而使用map会更有扩充性,例如,还可通过人名找电话号码等等,但是使用了map就不那么好用sort了。你可以用map试一试。 这里string的作用不只是可以存储字符串,还可以提供字符串的比较,查找等。在sort和unique函数中就默认使用了less 和equal_to函数, 上面的一段代码,其实使用了string的以下功能:
总之,有了string 后,C++的字符文本处理功能总算得到了一定补充,加上配合STL其他容器使用,其在文本处理上的功能已经与perl, shell, php的距离缩小很多了。 因此掌握string 会让你的工作事半功倍。
1 string 使用其实,string并不是一个单独的容器,只是basic_string 模板类的一个typedef 而已,相对应的还有wstring, 你在string 头文件中你会发现下面的代码:extern"C++"
string 其实相当于一个保存字符的序列容器,因此除了有字符串的一些常用操作以外,还有包含了所有的序列容器的操作。字符串的常用操作包括:增加、删除、修改、查找比较、链接、输入、输出等。详细函数列表参看附录 。不要害怕这么多函数,其实有许多是序列容器带有的,平时不一定用的上。 如果你要想了解所有函数的详细用法,你需要查看basic_string ,或者下载STL编程手册 。这里通过实例介绍一些常用函数。 1.1 充分使用string 操作符string 重载了许多操作符,包括 +, +=, <,=, , [], <<, >>等,正式这些操作符,对字符串操作非常方便。先看看下面这个例子:tt.cpp(例程2)
#include<string>
下面是程序的输出 -bash-2.05b$ make ttc++ -O -pipe -march=pentiumpro tt.cpp -o string, int > mymap;//以上默认使用了 less<string> string strinfo="Winter";
有了操作符以后,assign(), append(), compare(), at()等函数,除非有一些特殊的需求时,一般是用不上。当然at()函数还有一个功能,那就是检查下标是否合法,如果是使用: string str="winter";//下面一行有可能会引起程序中断错误 str[100]='!';//下面会抛出异常:throws: out_of_range cout<<str.at(100)<<endl; 1.2 眼花缭乱的string find 函数由于查找是使用最为频繁的功能之一,string 提供了非常丰富的查找函数。其列表如下:
size_type find_first_of(const basic_string& s, size_type pos = 0)
template<class _CharT, class _Traits, class _Alloc> const
basic_string<_CharT,_Traits,_Alloc> ::size_type basic_string<_CharT,_Traits,_Alloc> ::npos = basic_string<_CharT,_Traits,_Alloc> ::size_type -1; find 和 rfind 都还比较容易理解,一个是正向匹配,一个是逆向匹配,后面的参数pos都是用来指定起始查找位置。对于find_first_of 和find_last_of 就不是那么好理解。 find_first_of 是给定一个要查找的字符集,找到这个字符集中任何一个字符所在字符串中第一个位置。或许看一个例子更容易明白。 有这样一个需求:过滤一行开头和结尾的所有非英文字符。看看用string 如何实现:
#include<string>
#include<iostream> using namespace std; int main() { string strinfo="//*---Hello Word!......------"; string strset="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"; int first = strinfo.find_first_of(strset);
int last = strinfo.find_last_of(strset);
这里把所有的英文字母大小写作为了需要查找的字符集,先查找第一个英文字母的位置,然后查找最后一个英文字母的位置,然后用substr 来的到中间的一部分,用于输出结果。下面就是其结果:
if(first ==-1)&&(last ==-1) ) cout<<"not find any characters,the result is incorect!"<<endl; cout << strinfo.substr(first, last - first + 1)<<endl; return 0; } Hello Word 张三|3456123, 湖南李四,4564234| 湖北王小二, 4433253|北京... 1.3 string insert, replace, erase了解了string 的操作符,查找函数和substr,其实就已经了解了string的80%的操作了。insert函数, replace函数和erase函数在使用起来相对简单。下面以一个例子来说明其应用。string只是提供了按照位置和区间的replace函数,而不能用一个string字串来替换指定string中的另一个字串。这里写一个函数来实现这个功能:
void string_replace(string & strBig, const string & strsrc, const string &strdst)
看看如何调用:
{ string::size_type pos=0; string::size_type srclen=strsrc.size(); string::size_type dstlen=strdst.size(); while( (pos=strBig.find(strsrc, pos))) != pos += dstlen; }
#include<string>
其输出结果:
#include<iostream> using namespace std; int main() { string strinfo="This is Winter, Winter is a programmer. Do you know Winter?"; cout<<"Orign string is :/n"<<strinfo<<endl; string_replace(strinfo, "Winter", "wende"); cout<<"After replace Winter with wende, the string is :/n"<<strinfo<<endl; return 0; }
Orign string is :This is Winter, Winter is a programmer. Do you know Winter?
如果不用replace函数,则可以使用erase和insert来替换,也能实现string_replace函数的功能:
After replace Winter with wende, the string is :This is wende, wende is a programmer. Do you know wende?
void string_replace(string & strBig, const string & strsrc, const string &strdst)
当然,这种方法没有使用replace来得直接。
{ string::size_type pos=0; string::size_type srclen=strsrc.size(); string::size_type dstlen=strdst.size(); while( (pos=strBig.find(strsrc, pos))!=strBig.insert(pos, strdst)) pos += dstlen; } 2 string 和 C风格字符串现在看了这么多例子,发现const char* 可以和string 直接转换,例如我们在上面的例子中,使用string_replace(strinfo, "Winter ", "wende");
void string_replace(string & strBig, const string & strsrc, const string &strdst)
在C语言中只有char* 和 const char*,为了使用起来方便,string提供了三个函数满足其要求:
const charT* c_str() const
const charT* c_str () const
原来c_str()的流程是:先调用terminate(),然后在返回data()。因此如果你对效率要求比较高,而且你的处理又不一定需 要以/0的方式结束,你最好选择data()。但是对于一般的C函数中,需要以const char*为输入参数,你就要使用c_str()函数。
{ if(length () == 0) return ""; terminate (); return data (); } 对于c_str() data()函数,返回的数组都是由string本身拥有,千万不可修改其内容。其原因是许多string实现的时候采用了引用机制,也就是说,有可能几 个string使用同一个字符存储空间。而且你不能使用sizeof(string)来查看其大小。详细的解释和实现查看Effective STL 的条款15:小心string实现的多样性 。 另外在你的程序中,只在需要时才使用c_str()或者data()得到字符串,每调用一次,下次再使用就会失效,如: string strinfo("this is Winter ");...//最好的方式是: foo(strinfo.c_str());//也可以这么用: const char * pstr=strinfo.c_str();foo(pstr);//不要再使用了pstr了, 下面的操作已经使pstr无效了。 strinfo += " Hello! ";foo(pstr);//错误! 会遇到什么错误?当你幸运的时候pstr可能只是指向"this is Winter Hello!"的字符串, 3 string 和 Charactor Traits了解了string的用法,该详细看看string的真相了。前面提到string 只是basic_string的一个typedef。看看basic_string 的参数:template<class charT, class traits = char_traits<charT>,class Allocator = allocator<charT> >class basic_string
就像Steve Donovan在过度使用C++模板 中提到的,这些确实有些过头了,要不是系统自己定义了相关的一些属性,而且用了个typedef,否则还真不知道如何使用。 但复杂总有复杂道理。有了char_traits,你可以定义自己的字符串类型。当然,有了char_traits < char > 和char_traits < wchar_t > 你的需求使用已经足够了,为了更好的理解string ,咱们来看看char_traits都有哪些要求。 如果你希望使用你自己定义的字符,你必须定义包含下列成员的结构:
现在默认的string版本中,并不支持忽略大小写的比较函数和查找函数,如果你想练练手,你可以试试改写一个char_traits , 然后生成一个case_string类, 也可以在string 上做继承,然后派生一个新的类,例如:ext_string,提供一些常用的功能,例如:
4 string 建议使用string 的方便性就不用再说了,这里要重点强调的是string的安全性。
5 小结难怪有人说:string 使用方便功能强,我们一直用它!
6 附录string 函数列表
7 参考文章 |
<script type="text/javascript"> </script>