在C++11之后,std标准库引入正则表达式的功能,这个功能是比较常用的,因为对模式的匹配和识别,是一项经常需要运用的功能。比如在处理银行的一些数据文件,这些文件名称都是有一定的规律组成的,如果不使用正则表达式,怎么样来判断这些文件名称是否合法的数据文件?一般开发人员,就会一个字符一个字符地判断,是否符合相应的规则。如果使用正则表达式,就自己代码来得快速和灵活。比如有一批文件,它们的名称是这样命名的:
1000001_v2000.csv
前面一串1000001是数字,接着是下划线,紧接是版本号v2000,后面.csv是文件名称后缀。针对这个格式,可以使用C++ 11里的正则表达式来判断,代码如下:
#include "stdafx.h"
#include <string>
#include <regex>
#include <iostream>
int main()
{
std::wstring strTest = L"1000001_v2000.csv";
std::wsmatch wm;
std::wregex wrx(L"(\\d+)_v(\\d+)\\.csv");
if (std::regex_match(strTest, wm, wrx))
{
for (auto it : wm)
std::wcout << it.str().c_str() << std::endl;
}
return 0;
}
输出结果如下:
1000001_v2000.csv
1000001
2000
从结果里,就很轻松拿到前一串的序号,以及后面的文件的版本号,这样处理起来就很轻松了。如果不符这种规则的文件名称,就不会匹配成功。