正则表达式(regex) 迭代器(iterator) 的 详解 及 代码


本文地址: http://blog.csdn.net/caroline_wendy/article/details/17319899


正则表达式(regex), 使用boost的regex头文件, 是C++11的新标准, 但是gcc4.8.1并未完全支持, 所以使用boost库;

具体安装: http://blog.csdn.net/caroline_wendy/article/details/17282187


正则表达式的书写规范, 以ECMAScript为例, 使用迭代器可以遍历原字符串, 输出符合要求的所有字符串;

使用prefix()suffix()方法, 可以输出前一个未匹配的字符串和后一个未匹配的字符串;

正则表达式的子表达式(subexpressions), 可以分段输出正则表达式, 在正则表达式中, 以括号"()"分解;


代码如下:

#include <iostream> #include <string> #include <algorithm> #include <boost/regex.hpp>  using namespace std; using namespace boost;  int main() { 	std::string pattern("[^c]ei"); 	pattern = "[[:alpha:]]*" + pattern + "[[:alpha:]]*"; 	boost::regex r(pattern, regex::icase); //忽略大小写 	std::string str("Ruby Carolinei biubiubiu Weindy SpikeI Winnceiy"); 	//使用正则迭代器进行遍历 	for(boost::sregex_iterator it(str.begin(), str.end(), r), end_it; 			it!=end_it; ++it) 		std::cout << it->str() << std::endl;  	//输出正则表达式的前后字符串 	std::cout << std::endl; 	for(boost::sregex_iterator it(str.begin(), str.end(), r), end_it; 			it!=end_it; ++it){ 		auto pos = it->prefix().length(); 		pos = pos>40 ? pos-40 : 0; 		std::cout << it->prefix().str().substr(pos) /*输出前一个未匹配的字符串*/ 				<< "\n\t\t>>>" << it->str() << "<<<\n" 				<< it->suffix().str().substr(0, 40) /*输出之后的字符串*/ 				<<std::endl; 	}  	//匹配子表达式 	std::string filename("File.cqp MyGod.cpP"); 	boost::regex rsub("([[:alnum:]]+)\\.(cpp|cxx|cc)$", regex::icase); 	smatch results; 	if(boost::regex_search(filename, results, rsub)) 		std::cout << results.str(1) << std::endl; } 

输出:

Carolinei Weindy SpikeI  Ruby  		>>>Carolinei<<<  biubiubiu Weindy SpikeI Winnceiy  biubiubiu  		>>>Weindy<<<  SpikeI Winnceiy   		>>>SpikeI<<<  Winnceiy MyGod