vc6.0下使用boost regex正则表达式匹配带中文的任意字符

最新推荐文章于 2023-05-26 00:10:00 发布

山城棒棒军军长

最新推荐文章于 2023-05-26 00:10:00 发布

阅读量1.1k

点赞数

分类专栏： VC++ MFC

本文链接：https://blog.csdn.net/jinyaba/article/details/17148229

版权

VC++ MFC 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

源代码：

boost::cmatch result2;

// 特殊字符"."和"\"从字符串转为正则表达式需要加"\"，在正则表达式中要单纯的表示反斜杠字符页需要加"\"，所以要匹配".\ "应该写为"\\.\\\\"
CString csReg = "\\.\\\\(\\S+)\\.[tsp|enx|ts|tc|tsw]"; // 匹配以 .\ 开头 .tsp|.enx|.ts|.tc|.tsw 结尾的任意字符串，并获取匹配到的字符串
boost::regex regText;
regText = csReg;
string sToMatch((LPCTSTR)csSourceStr);
if ( !boost::regex_search(sToMatch,result2,regText))
{
return FALSE;
}

//下标从1开始， result2[0] 不正确
for (size_t i = 1; i < result2.size(); ++i)
{
  if (result2[i].matched)

   {
   std::string strIs(result2[i].first,result2[i].second);
   csDestStr = strIs.c_str();
  }
}
return TRUE;

测试代码未进行宽字符转换：

BOOL CSelectTestInstance::regexMatchStr(const CString &csSourceStr,CString &csDestStr)
{
boost::cmatch result2;
boost::regex regText("[A-Za-z0-9_\x80-\xFF]+");//如果匹配的字符串为./硬测自动化/自动化.tc ，匹配的结果只能匹配到“硬测自动化”，不知为何

string sToMatch((LPCTSTR)csSourceStr);//csSourceStr = ./硬测自动化_A_1.tc
if ( !boost::regex_search(sToMatch,result2,regText))
{
     return FALSE;
  }
for (size_t i = 0; i < result2.size(); ++i)
{
  if (result2[i].matched)
   {
   std::string strIs(result2[i].first,result2[i].second);
   csDestStr = strIs.c_str();
   }
}
return TRUE;
}