C/C++的字符串操作(二)

一、char_traits 字符特征类
1)意义:包装特定串元素的通用行为界面,以便容器实现时依据特征信息而执行特定行为
2)定义了通用类型名 

typedef _Elem char_type;
typedef int int_type;
typedef streampos pos_type;
typedef streamoff off_type;
typedef mbstate_t state_type; 

其中 int_type 表示字符元素转换到特定编码时的整型表示,pos_type,off_type 分别作为字符串索引和字符串元素偏移的类型,类似容器迭中的指针,迭代类型和指针,迭代器的偏移类型。最后的 state_type 用于存储流状态,如出错,格式控制等等。 

3)定义了字符 / 字符串操作的包装界面,以便通用算法的调用 

assign(a, b) 定义将 b 字符赋值给 a 字符的过程,实现 a.operator = 的行为
eq(a, b) 定义 a 字符和 b 字符的相等关系,实现 a.operator == 的行为
lt(a, b) 定义 a 小于 b 的关系,实现 a.operator < 的行为
compare(a_ptr, b_ptr, cnt) 定义两组字符串的比较,返回 int 类型,实现类似 memcmp 的行为
length(ptr) 定义取字符串长度,实现类似 strlen 的行为
copy(a_ptr, b_ptr, cnt) 定义两组字符串的复制,实现类似 memcpy 的行为
move(a_ptr, b_ptr, cnt) 定义两组字符串的不重叠复制,实现类似 memmove 的行为
assign(ptr, cnt, ch) 定义了填充字符串的过程,实现类似 memset 的行为
to_int_type(ch) 定义了 char_type 到int_type 整型的转换过程
to_char_type(n) 定义了 int_type 到char_type 字符型的转换过程
eq_int_type(a, b) 定义两个和当前 char_type 类型对应的 int_type 的相等关系
eof() 定义字符串结尾符,使用整型表示
not_eof(n) 定义非字符串结尾符,若输入结尾符,则返回 1,其他输入返回原值,即总是不返回 eof() 

4)int_type 类型应是当前字符类型的整型编码 

二、std::string 并不是序列容器,没有front() 和 back() 界面用于取出前端和尾端的元素,使用 std::string::operator [] 并传递 streampos 类型取得特定元素,如 std::string::size() - 1 作为索引取得最后一个字符 


三、basic_string 支持的初始化
1)默认初始化
2)分配器
3)复制构造
4)局部复制 [_Roff, _Roff + _Count)
5)局部复制 + 分配器
6)C 字符串 [_Ptr, <null>)
7)C 字符串 + _Count [_Ptr, _Ptr +_Count)
8)C 字符串 + 分配器
9)C 字符串 + _Count + 分配器 [_Ptr, _Ptr + _Count)

10)_Count * _Ch
11)_Count * _Ch + 分配器
12)迭代器 [_ItF, _ItL)
13)迭代器 + 分配器 

字符到串不能初始化,但支持 operator = 赋值和operator += 累加赋值运算。 

四、字符串的区间有效性
对串的索引访问在超过字符串的有效区间时,因为串的在实现上对内置的字符缓冲区执行下标访问,所以不会导致异常,但是将得到不可预知的结果,通常是不可用的。
将其他字符串作为右值输入时,对该串取出计数大于串大小时按串大小计算。
std::basic_string::size_type 的实际类型为 size_t,在 Visual C++ 7.1 中实现为 unsigned,std::basic_string::npos 被静态设定为 

(basic_string<_Elem, _Traits,_Alloc>::size_type)(-1); 

在查找子字符串等操作时,函数返回 npos 的值表示非法索引。 


五、比较字符串
允许的比较对象
1)compare(s2) 其他同类型字符串
2)compare(p) C 风格字符串
3)compare(off, cnt, s2) [off, off + cnt) 同 s2 执行比较
4)compare(off, cnt, s2, off2, cnt2) [off, off + cnt) 同 s2 [off2, cnt2) 执行比较
5)compare(off, cnt, p) [off, off + cnt) 同 [p , <null>) 执行比较
6)compare(off, cnt, p, cnt2) [off, off + cnt) 同 [p, p + cnt2) 执行比较 

返回 -1, 0, 1 作为小于、等于和大于的比较结果。 

 六、附加数据
1)使用 operator += 接受其他字符串,C 风格字符串和字符
2)使用 push_back() 在尾部附加字符,并使得通过字符串构造的 back_iterator 可以访问
3)append() 附加
        1、append(s) 追加字符串
        2、append(s,off, cnt) 追加字符串 s [off, off + cnt)
        3、append(p) 追加字符串 [p, <null>)
        4、append(p,cnt) 追加字符串 [p, p + cnt)
        5、append(n,c) 填充 n * c
        6、append(InF,InL) 追加输入流 [InF, InL) 

4)insert() 插入
        1、insert(off,s2) 插入字符串
        2、insert(off,s2, off2, cnt2) 插入字符串 s [off2, off2 + cnt2)
        3、insert(off,p) 插入字符串 [p, <null>)
        4、insert(off,p, cnt) 插入字符串 [p, p + cnt)

        5、insert(off, n, c) 插入 n * c
        6、insert(iter)元素默认值填充
        7、insert(iter,c) 插入特定元素
        8、insert(iter,n, c) 插入 n*c
        9、insert(iter,InF, InL) 插入 [InF, InL) 

5)operator +(a, b)
字符串关联运算符重载中支持 operator + 的形式
        1、s + s
        2、s + p
        3、s + c
        4、p + s
        5、c +s 

七、查找、替换和清除
1)find() 查找
        1、find(c,off) 在 s [off, npos) 中查找 c
        2、find(p,off, n) 在 s [off, npos) 中查找 [p,p + n)
        3、find(p,off) 在 s [off, npos) 中查找 [p,<null>)
        4、find(s2,off) 在 s [off, npos) 中查找s2 

2)find() 的变种
        1、rfind() 具有 find() 的输入形式,反序查找
        2、find_first_of()具有 find() 的输入形式,返回第一个匹配的索引
        3、find_last_of()具有 find() 的输入形式,返回倒数第一个匹配的索引
        4、find_first_not_of()具有 find() 的输入形式,返回第一个不匹配的索引
        5、find_last_not_of()具有 find() 的输入形式,返回倒数第一个不匹配的索引 

3)replace() 替换
        1、replace(off,cnt, s2) 将 s [off, off + cnt) 替换成 s2
        2、replace(off,cnt, s2, off2, cnt2) 将 s [off, off + cnt) 替换成 s2 [off2, off2 + cnt2)
        3、replace(off,cnt, p) 将 s [off, off + cnt) 替换成 [p, <null>)
        4、replace(off,cnt, p, cnt2) 将 s [off, off + cnt) 替换成 [p, p + cnt2)

        5、replace(off, cnt, n, c) 将 s [off, off + cnt)替换成 c * n 

使用迭代器的情况:
        6、replace(InF,InL, s2) 将 [InF, InL) 替换成 s2
        7、replace(InF,InL, p) 将 [InF, InL) 替换成 [p,<null>)
        8、replace(InF,InL, p, cnt) 将 [InF, InL) 替换成[p, p + cnt)
        9、replace(InF,InL, n, c) 将 [InF, InL) 替换成 n *c
        10、replace(InF,InL, InF2, InL2) 将 [InF, InL) 替换成 [InF2, InL2) 

4)erase() 删除
        1、erase(off,cnt) 从字符串 s 中删除 s [off, off +cnt)
        2、erase(iter)从字符串 s 中删除 *iter
        3、erase(ItF,ItL) 从字符串 s 中删除 [ItF,ItL) 

八、取出字符串
1)取得 C 风格字符串
c_str() 返回常量类型的 C 风格字符串指针,copy(ptr,cnt, off = 0) 则将指定大小的字符串复制到特定指针。data() 在 Visual C++ 7.1 中仅仅调用了 c_str() 实现。 
2)取得子字符串
substr(off, cnt) 取得 s [off, off + cnt) 的副本。 
3)复制子字符串
copy(p, off, cnt) 将 s [off, off + cnt) 复制到 p。 


九、字符串的缓冲区管理
字符串具有类似 std::vector 的缓冲区管理界面。 
size() 取得有效元素长度
max_size() 取得当前内存分配器能分配的有效空间
reserve() 为缓冲区预留空间
capacity() 取得缓冲区的容量
resize() 重设串的长度,可以为其指定初始化值 

十、定义输入迭代器的尾端
向 istream_iterator 传递输入流对象以创建输入迭代器,输入迭代器持有输入流对象的指针,默认创建和读取流失败的情况下该指针被设置为 0。并且在实现输入迭代器间的 operator == 相等运算时,进行持有的流对象指针的相等比较,这样,默认创建的输入迭代器将被用于匹配输入流的结束。 

* 当输入流读取失败,用户执行 if, while 条件判断时,实际上先将判断值转换成 void* 类型,或者根据 operator ! 运算符的返回结果,对输入流重载 operator void* 和 operator ! 运算符,可以定义输入流在布尔表达式中的行为,使得当流读取失败的情况下,输入迭代器可以通过布尔表达式来确认,而不是显式访问 fail() 成员函数.
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值