toupper,tolower 地球人都知道 C++ 的 string 没有 toupper、tolower ,好在这不是个大问题,因为我们有 STL 算法:
------------------------------------------------------------------------ trim 我们还知道 string 没有 trim ,不过自力更生也不困难,比 toupper 来的还要简单:
----------------------------------------------------------------------- erase string 本身的 erase 还是不错的,但是只能 erase 连续字符,如果要拿掉一个字符串里面所有的某个字符呢?用 STL 的 erase + remove_if 就可以了,注意光 remove_if 是不行的。
----------------------------------------------------------------------- replace string 本身提供了 replace ,不过并不是面向字符串的,譬如我们最常用的把一个 substr 换成另一个 substr 的操作,就要做一点小组合:
----------------------------------------------------------------------- startwith, endwith 这两个可真常用,不过如果你仔细看看 string 的接口,就会发现其实没必要专门提供这两个方法,已经有的接口可以干得很好:
------------------------------------------------------------------------ toint, todouble, tobool... 这也是老生常谈了,无论是 C 的方法还是 C++ 的方法都可以,各有特色:
------------------------------------------------------------------------ split 这可是件麻烦事,我们最希望的是这样一个接口: s.split(vect, ',') 。用 STL 算法来做有一定难度,我们可以从简单的开始,如果分隔符是空格、tab 和回车之类,那么这样就够了:
------------------------------------------------------------------------ concat 把一个装有 string 的容器里面所有的 string 连接起来,怎么做?希望你不要说是 hand code 循环,这样做不是更好?
------------------------------------------------------------------------- reverse 其实我比较怀疑有什么人需要真的去 reverse 一个 string ,不过做这件事情的确是很容易:
------------------------------------------------------------------------- 解析文件扩展名 字数多点的写法:
|
STL 算法
distance
很多时候我们希望在一个 vector ,或者 list ,或者什么其他东西里面,找到一个值在哪个位置,这个时候 find 帮不上忙,而有人就转而求助手写循环了,而且是原始的手写循环:
-------------------------------------------------------------------------- max, min 这是有直接的算法支持的,当然复杂度是 O(n),用于未排序容器,如果是排序容器...老兄,那还需要什么算法么?
------------------------------------------------------------------------- copy_if 没错,STL 里面压根没有 copy_if ,这就是为什么我们需要这个:
------------------------------------------------------------------------ 惯用手法:erase(iter++) 如果你要去除一个 list 中的某些元素,那可千万小心:(下面的代码是错的!!!) #include <iostream> #include <algorithm> #include <iterator> #include <list> int main() { int arr[] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}; std::list<int> lst(arr, arr + 10); for ( std::list<int>::iterator iter = lst.begin(); iter != lst.end(); ++iter) if ( *iter % 2 == 0 ) lst.erase(iter); std::copy(lst.begin(), lst.end(), std::ostream_iterator<int>(std::cout, " ")); } 当 iter 被 erase 掉的时候,它已经失效,而后面却还会做 ++iter ,其行为无可预期!如果你不想动用 remove_if ,那么唯一的选择就是: #include <iostream> #include <algorithm> #include <iterator> #include <list> int main() { int arr[] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}; std::list<int> lst(arr, arr + 10); for ( std::list<int>::iterator iter = lst.begin(); iter != lst.end() ; ) if ( *iter % 2 == 0 ) lst.erase(iter++); else ++iter; std::copy(lst.begin(), lst.end(), std::ostream_iterator<int>(std::cout, " ")); } 但是上面的代码不能用于 vector, string 和 deque ,因为对于这些容器, erase 不光令 iter 失效,还令 iter 之后的所有 iterator 失效! 下面给出vector的例子
------------------------------------------------------------------------- erase(remove...) 惯用手法 上面的循环如此难写,如此不通用,如此不容易理解,还是用 STL 算法来的好,但是注意,光 remove_if 是没用的,必须使用 erase(remove...) 惯用手法:
|
简单常识——关于stream
当然,这样没有错,但是包含不必要的繁琐和拷贝,况且,如果一行超过1000个字符,就必须用一个循环和更麻烦的缓冲管理。下面这样岂不是更简单?
不仅简单,而且安全,因为全局函数 getline 会帮你处理缓冲区用完之类的麻烦,如果你不希望空间分配发生的太频繁,只需要多 reserve 一点空间。 这就是“简单常识”的含义,很多东西已经在那里,只是我一直没去用。 --------------------------------------------------------------------------- 一次把整个文件读入一个 string 我希望你的答案不要是这样:
当然了,没有错,它能工作,但是下面的办法是不是更加符合 C++ 的精神呢?
同样,事先分配空间对于性能可能有潜在的好处:
很简单,不是么?但是这些却是我们经常忽略的事实。 补充一下,这样干是有问题的:
因为它会忽略所有的分隔符,你会得到一个纯“字符”的字符串。最后,如果你只是想把一个文件的内容读到另一个流,那没有比这更快的了:
因此,如果你要手工 copy 文件,这是最好的(如果不用操作系统的 API):
------------------------------------------------------------------------- open 一个文件的那些选项 ios::in Open file for reading ios::out Open file for writing ------------------------------------------------------------------------- 还有 ios 的那些 flag
There are also defined three other constants that can be used as masks:
-------------------------------------------------------------------------- 用我想要的分隔符来解析一个字符串,以及从流中读取数据 这曾经是一个需要不少麻烦的话题,由于其常用而显得尤其麻烦,但是其实 getline 可以做得不错:
简单吧?不过注意,由于这个时候 getline 只把 ; 作为分隔符,所以你需要用 ;quit; 来结束输入,否则 getline 会把前后的空格和回车都读入 s ,当然,这个问题可以在代码里面解决。 同样,对于简单的字符串解析,我们是不大需要动用什么 Tokenizer 之类的东西了:
输出: hello world this is a sentence; and a word end. 很漂亮不是么?不过这么干的缺陷在于,只有一个字符可以作为分隔符。 -------------------------------------------------------------------------- 把原本输出到屏幕的东西输出到文件,不用到处去把 cout 改成 fs
输出到屏幕的是: display something on screen 输出到文件的是: write something to file 也就是说,只要改变 ostream 的 rdbuf ,就可以重定向了,但是这招对 fstream 和 stringstream 都没用。 -------------------------------------------------------------------------- 关于 istream_iterator 和 ostream_iterator 经典的 ostream_iterator 例子,就是用 copy 来输出:
输出: 1 2 3 4 5 6 7 8 9 1 ~ 2 ~ 3 ~ 很明显,ostream_iterator 的作用就是允许对 stream 做 iterator 的操作,从而让算法可以施加于 stream 之上,这也是 STL 的精华。与前面的“读取文件”相结合,我们得到了显示一个文件最方便的办法:
同样,如果你用下面的语句,得到的会是没有分隔符的输出:
那多半不是你要的结果。如果你硬是想用 istream_iterator 而不是 istreambuf_iterator 呢?还是有办法:
但是这样不是推荐方法,它的效率比第一种低不少。 12345 234 567 89 10 程序:
输出: 12345 234 567 89 10 很酷不是么?判断文件结束、移动文件指针之类的苦工都有 istream_iterator 代劳了。 ----------------------------------------------------------------------- 其它算法配合 iterator 计算文件行数:
当然确切地说,这是在计算文件中回车符的数量,同理,你也可以计算文件中任何字符的数量,或者某个 token 的数量:
注意上面计算的是 “#include” 作为一个 token 的数量,如果它和其他的字符连起来,是不算数的。 ------------------------------------------------------------------------ Manipulator 是什么?简单的说,就是一个接受一个 stream 作为参数,并且返回一个 stream 的函数,比如上面的 unskipws ,它的定义是这样的:
这里它用了更通用的 ios_base 。知道了这一点,你大概不会对自己写一个 manipulator 有什么恐惧感了,下面这个无聊的 manipulator 会忽略 stream 遇到第一个分号之前所有的输入(包括那个分号):
不过注意,它不会忽略以后的分号,因为 ignore 只执行了一次。更通用一点,manipulator 也可以接受参数的,下面这个就是 ignoreToSemicolon 的通用版本,它接受一个参数, stream 会忽略遇到第一个该参数之前的所有输入,写起来稍微麻烦一点:
但是用法差不多:
其效果跟 IgnoreToSemicolon 一样。
STL算法学习,小结如下: 前提: 下载stl源码: http://www.sgi.com/tech/stl/download.html 打开网页: http://www.sgi.com/tech/stl/stl_index.html 一.函数对象: 因为很多的算法中多使用了函数对象 二元函数对象,V1和V2为输入,V3为结果 二.函数对象发生器:主要用来填充序列。 产生不重复的随机数:
三.函数对象适配器 : 将函数转化为函数对象 ptr_fun:一般函数适配器 一元实例: transform(first, last, first,compose1(negate<double>, ptr_fun(fabs))); not1:对一元的断定函数对象取反的适配器。 shape是一个指针变量,则foreach(v.begin(),v.end(),mem_fun(&shape::draw)); 但如果shape是一般的变量,不是指针,则foreach(v.begin(),v.end(),mem_fun_ref(&shape::draw)); 四.算法:
五.所有的算法: accumlate : iterator 对标志的序列中的元素之和,加到一个由 init 指定的初始值上。重载的版本不再做加法,而是传进来的二元操作符被应用到元素上。 adjacent_different :创建一个新序列,该序列的每个新值都代表了当前元素与上一个元素的差。重载版本用指定的二元操作计算相邻元素的差。 adjacent_find :在 iterator 对标志的元素范围内,查找一对相邻的重复元素,如果找到返回一个 ForwardIterator ,指向这对元素的第一个元素。否则返回 last 。重载版本使用输入的二元操作符代替相等的判断。 binary_search :在有序序列中查找 value ,如果找到返回 true 。重载的版本使用指定的比较函数对象或者函数指针来判断相等。 copy :复制序列 copy_backward :除了元素以相反的顺序被拷贝外,别的和 copy 相同。 count :利用等于操作符,把标志范围类的元素与输入的值进行比较,并返回相等元素的个数 count_if :对于标志范围类的元素,应用输入的操作符,并返回结果为 true 的次数。 equal :如果两个序列在范围内的元素都相等,则 equal 返回 true 。重载版本使用输入的操作符代替了默认的等于操作符。 equal_range :返回一对 iterator ,第一个 iterator 表示由 lower_bound 返回的 iterator ,第二个表示由 upper_bound 返回的 iterator 值。 fill :将输入的值的拷贝赋给范围内的每个元素。 fill_n :将输入的值赋值给 first 到 frist+n 范围内的元素。 find :利用底层元素的等于操作符,对范围内的元素与输入的值进行比较。当匹配时,结束搜索,返回该元素的一个 InputIterator 。 find_if :使用输入的函数替代了等于操作符执行了 find 。 find_end :在范围内查找“由输入的另外一个 iterator 对标志的第二个序列”的最后一次出现。重载版本中使用了用户输入的操作符替代等于操作。 find_first_of :在范围内查找“由输入的另外一个 iterator 对标志的第二个序列”中的任意一个元素的第一次出现。重载版本中使用了用户自定义的操作符。 for_each :依次对范围内的所有元素执行输入的函数。 generate :通过对输入的函数 gen 的连续调用来填充指定的范围。 generate_n :填充 n 个元素。 includes :判断 [first1, last1) 的一个元素是否被包含在另外一个序列中。使用底层元素的 <= 操作符,重载版本使用用户输入的函数。 inner_product :对两个序列做内积 ( 对应的元素相乘,再求和 ) ,并将内积加到一个输入的的初始值上。重载版本使用了用户定义的操作。 inner_merge :合并两个排过序的连续序列,结果序列覆盖了两端范围,重载版本使用输入的操作进行排序。 iter_swap :交换两个 ForwardIterator 的值。 lexicographical_compare :比较两个序列。重载版本使用了用户自定义的比较操作。 lower_bound :返回一个 iterator ,它指向在范围内的有序序列中可以插入指定值而不破坏容器顺序的第一个位置。重载函数使用了自定义的比较操作。 max :返回两个元素中的较大的一个,重载版本使用了自定义的比较操作。 max_element :返回一个 iterator ,指出序列中最大的元素。重载版本使用自定义的比较操作。 min :两个元素中的较小者。重载版本使用自定义的比较操作。 min_element :类似与 max_element ,不过返回最小的元素。 merge :合并两个有序序列,并存放到另外一个序列中。重载版本使用自定义的比较。 mismatch :并行的比较两个序列,指出第一个不匹配的位置,它返回一对 iterator ,标志第一个不匹配的元素位置。如果都匹配,返回每个容器的 last 。重载版本使用自定义的比较操作。 next_permutation :取出当前范围内的排列,并将其重新排序为下一个排列。重载版本使用自定义的比较操作。 nth_element :将范围内的序列重新排序,使所有小于第 n 个元素的元素都出现在它前面,而大于它的都出现在后面,重载版本使用了自定义的比较操作。 partial_sort :对整个序列做部分排序,被排序元素的个数正好可以被放到范围内。重载版本使用自定义的比较操作。 partial_sort_copy :与 partial_sort 相同,除了将经过排序的序列复制到另外一个容器。 partial_sum :创建一个新的元素序列,其中每个元素的值代表了范围内该位置之前所有元素之和。重载版本使用了自定义操作替代加法。 partition :对范围内元素重新排序,使用输入的函数,把计算结果为 true 的元素都放在结果为 false 的元素之前。 prev_permutation :取出范围内的序列并将它重新排序为上一个序列。如果不存在上一个序列则返回 false 。重载版本使用自定义的比较操作。 random_shuffle :对范围内的元素随机调整次序。重载版本输入一个随机数产生操作。 remove :删除在范围内的所有等于指定的元素,注意,该函数并不真正删除元素。内置数组不适合使用 remove 和 remove_if 函数。 remove_copy :将所有不匹配的元素都复制到一个指定容器,返回的 OutputIterator 指向被拷贝的末元素的下一个位置。 remove_if :删除所有范围内输入操作结果为 true 的元素。 remove_copy_if :将所有不匹配的元素拷贝到一个指定容器。 replace :将范围内的所有等于 old_value 的元素都用 new_value 替代。 replace_copy :与 replace 类似,不过将结果写入另外一个容器。 replace_if :将范围内的所有操作结果为 true 的元素用新值替代。 replace_copy_if :类似与 replace_if ,不过将结果写入另外一个容器。 reverse :将范围内元素重新按反序排列。 reverse_copy :类似与 reverse ,不过将结果写入另外一个容器。 rotate :将范围内的元素移到容器末尾,由 middle 指向的元素成为容器第一个元素。 rotate_copy :类似与 rotate ,不过将结果写入另外一个容器。 search :给出了两个范围,返回一个 iterator ,指向在范围内第一次出现子序列的位置。重载版本使用自定义的比较操作。 search_n :在范围内查找 value 出现 n 次的子序列。重载版本使用自定义的比较操作。 set_difference :构造一个排过序的序列,其中的元素出现在第一个序列中,但是不包含在第二个序列中。重载版本使用自定义的比较操作。 set_intersection :构造一个排过序的序列,其中的元素在两个序列中都存在。重载版本使用自定义的比较操作。 set_symmetric_difference :构造一个排过序的序列,其中的元素在第一个序列中出现,但是不出现在第二个序列中。重载版本使用自定义的比较操作。 set_union :构造一个排过序的序列,它包含两个序列中的所有的不重复元素。重载版本使用自定义的比较操作。 sort :以升序重新排列范围内的元素,重载版本使用了自定义的比较操作。 stable_partition :与 partition 类似,不过它不保证保留容器中的相对顺序。 stable_sort :类似与 sort ,不过保留相等元素之间的顺序关系。 swap :交换存储在两个对象中的值。 swap_range :将在范围内的元素与另外一个序列的元素值进行交换。 transform :将输入的操作作用在范围内的每个元素上,并产生一个新的序列。重载版本将操作作用在一对元素上,另外一个元素来自输入的另外一个序列。结果输出到指定的容器。 unique :清除序列中重复的元素,和 remove 类似,它也不能真正的删除元素。重载版本使用了自定义的操作。 unique_copy :类似与 unique ,不过它把结果输出到另外一个容器。 upper_bound :返回一个 iterator ,它指向在范围内的有序序列中插入 value 而不破坏容器顺序的最后一个位置,该位置标志了一个大于 value 的值。重载版本使用了输入的比较操作。 堆算法: C++ 标准库提供的是 max-heap 。一共由以下 4 个泛型堆算法。 make_heap :把范围内的元素生成一个堆。重载版本使用自定义的比较操作。 pop_heap :并不是真正的把最大元素从堆中弹出,而是重新排序堆。它把 first 和 last-1 交换,然后重新做成一个堆。可以使用容器的 back 来访问被“弹出“的元素或者使用 pop_back 来真正的删除。重载版本使用自定义的比较操作。 push_heap :假设 first 到 last-1 是一个有效的堆,要被加入堆的元素在位置 last-1 ,重新生成堆。在指向该函数前,必须先把元素插入容器后。重载版本使用指定的比较。 sort_heap :对范围内的序列重新排序,它假设该序列是个有序的堆。重载版本使用自定义的比较操作。
|