一 :正则表达式
语法
1.(pattern) 匹配pattern并获取这一匹配。
所获取的匹配可以从产生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中则使用$0…$9属性。要匹配圆括号字符,请使用“\(”或“\)”。
2.(?:pattern) 匹配pattern但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分是很有用。
例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。
3.\w 匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]”。
4.\W 匹配任何非单词字符。等价于 '[^A-Za-z0-9_]'。
5. + zo+ zo zoo zoo
6.{n}重复n次
常见的正则表示式分析 :
http://v\.youku\.com/v_show/id_((?:\w|=)+)_rss.*
^http://blog\.sina\.com\.cn/s/blog_([0-9a-zA-Z]{8}\w{8}).htm.+
二: 在c++中使用正则表达式
1. Boost库 #include <boost/regex.hpp>
2. boost::regex_match 函数
boost::cmatch result
regex_table_t regex_table
用法示例:
todo
3.基本常用函数(todo)
4.取匹配的字符串内容(todo)