总第34篇
本文主要对C++11/14标准库中的正则表达式的扩充进行详细总结说明,以方便大家在学习工作过程中参考。
1.正则表达式
正则表达式是描述一种字符串匹配的模式。一般使用正则表达式主要实现下面三个需求:
a
:检查一个串是否包含某种形式的子串;b
:将匹配的子串替换;c
:从某个串取出符合条件的子串;
正则表达式是由普通字符和特殊字符组成的文字模式,模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
详细的正则表达式说明,可以参考这篇文章:
一文快速全面掌握正则表达式+常用正则表达式示例_GitChatgitbook.cn2.std::regex
及其相关
在传统的C++中,使用正则表达式一般是用boost
正则表达式库。而C++11中,正式将正则表达式的处理方法纳入标准库的行列,从语言层面提供了标准的支持,不再依赖第三方。
C++11中,提供正则表达式库操作std::string
对象,模式std::regex
进行初始化,通过std::regex_match
进行匹配,从而产生std::smatch
对象 。下面是一个例子,通过例子我们可以了解其使用方法。我们考虑有下面的正则表达式:
[a-z]+.txt
:这个表达式匹配纯小写字母的文本文件名
std::regex_match
用于匹配字符串和正则表达式,有多种同的重载形式,最简单的一个形式就是传入std::string
以及一个std::regex
进行匹配,当匹配成功时,返回true
,否则返回false
。其代码如下:
#include <iostream>
#include <string>
#include <regex>
int main()
{
std::string fnames[] = {"foo.txt", "bar.txt", "test", "a0.txt", "AAA.txt"};
// 在 C++ 中 `` 会被作为字符串内的转义符,为使 `.` 作为正则表达式传递进去生效,需要对 `` 进行二次转义,从而有 `.`
std::regex txt_regex("[a-z]+.txt");
for (const auto &fname: fnames)
std::cout << fname << ": " << std::regex_match(fname, txt_regex) << std::endl;
}
//其输出结果为:
/*
foo.txt: 1
bar.txt: 1
test: 0
a0.txt: 0
AAA.txt: 0
另一种常用的形式是依次传入std::string
、std::smatch
和std::regex
三个参数,其中std::smatch
本质上就是std::match_results
,使用std::smatch
可以方便的对匹配结果进行获取。示例如下:
std::regex base_regex("([a-z]+).txt");
std::smatch base_match;
for(const auto &fname: fnames) {
if (std::regex_match(fname, base_match, base_regex)) {
// sub_match 的第一个元素匹配整个字符串
// sub_match 的第二个元素匹配了第一个括号表达式
if (base_match.size() == 2) {
std::string base = base_match[1].str();
std::cout << "sub-match[0]: " << base_match[0].str() << std::endl;
std::cout << fname << " sub-match[1]: " << base << std::endl;
}
}
}
//其输出结果为:
/*
sub-match[0]: foo.txt
foo.txt sub-match[1]: foo
sub-match[0]: bar.txt
bar.txt sub-match[1]: bar
本文到此结束!
如果对你有帮助,请随手 点赞 或 点喜欢!
=======================================================
欢迎【关注、私信 @武三郎】。我们一起交流一起进步。