对话框模板,RegexTest

我想用 MFC 和 C++ 创建一个基于对话框的程序(主窗口本身是个对话框)。我不想使用资源(.rc)文件,而是想在内存中动态创建对话框。我在 MSDN 中找到一些线索,但没有发现代码例子。我了解到 DLGTEMPLATE 和 DLGITEMTEMPLATE 结构以及 InitModalIndirect 函数或许可以用来创建模式对话框,但我不知道从何入手。请问如何不依赖资源文件动态创建对话框?

Thomas Zeitlberger

从理论上讲,动态创建对话框很简单,但实际上那样做很危险。就是内存中创建正确的结构并调用一系列 Indirect 对话框创建函数之一:用 CDialog::CreateIndirect 创建非模式对话框,或者用 CDialog::InitModalIndirect 创建模式对话框(然后调用 DoModal 运行)。它们分别对应着 Win32 API 函数 ::CreateDialogIndirect 和 ::DialogBoxIndirect。不管用什么方法,你都得在内存中传递一个指向对话框模板的指针。

从概念上讲,创建对话框模板很简单,就是在内存中建立并初始化相关结构。其具体细节是有讲究的,因为这些结构有点奇奇怪怪,很诡诈,你不得有一点差错,只要有一个字节的偏差,那么你的程序便会莫名其妙地垮掉。控件的位置和大小计算也会出现混乱,原因是对话框不使用像素,而是用对话框单位(units),它依赖对话框的字体。

要完整地讨论包含所有类型控件的对话框模板不是本专栏所能胜任的。但我可以提供一个简单的例子,它至少包含一个控件。我写了一个类:CStringDialog,它显示一个对话框,请求用户输入一个字符串,如图 Figure 1 所示。

Figure 1 String Dialog

为了使用这个类,你只需实例化然后调用 Init 和 DoModal 即可:

1. CStringDialog dlg;
2. dlg.Init(_T("Hi"), _T("Please enter your name:"));
3. if (dlg.DoModal()==IDOK) {
4. CString name = dlg.m_str;
5. // do something with it...
6. }

CStringDialog 的样子和行为类似于所有基于对话框资源的 CDialog 派生类,所不同的是该对话框用其自身模板在内存中动态生成。

那么对话框模板到底是个什么东西呢?对话框模板其实就是一个描述对话框的内存结构。这个模板之所以复杂并容易出错,是因为它并非像 CREATESTRUCT 和 WNDCLASS 一样是个定长结构。它是一个变长结构,其中包含有定长结构元素 DLGTEMPLATE 以及 DLGITEMTEMPLATE 结构数组,其每个数组元素对应着一个对话框控件项。DLGTEMPLATE 和 DLGITEMTEMPLATE 两者都包含一些跟在 C 结构后面非常很特别的变长域。这些结构如 Figure 2 所示,Figure 3 是整个结构的布局。

01. Figure 2DlgTemplate.cpp
02.  
03. // one of these for the dialog
04. typedef struct {
05. DWORD style;
06. DWORD dwExtendedStyle;
07. WORD cdit;
08. short x;
09. short y;
10. short cx;
11. short cy;
12. // variable-length stuff follows
13. } DLGTEMPLATE;
14.  
15. // one of these for each dialog item (control)
16. typedef struct {
17. DWORD style;
18. DWORD dwExtendedStyle;
19. short x;
20. short y;
21. short cx;
22. short cy;
23. WORD id;
24. // variable-length stuff follows
25. } DLGITEMTEMPLATE;

 

Figure 3 对话框模板

对话框模板有点像汇编语言编程手册中的内容,现在就让我们穿上蹩脚的工作制服,立即从 DLGTEMPLATE 开始吧。

假设你分配了一块足够大的内存来存放整个对话框模板,首先要做的事情就填写 DLGTEMPLATE 结构域。这一部分不难:

1. WORD* pTempl = new WORD[1024];
2. DLGTEMPLATE& dt = *((DLGTEMPLATE*)pTempl);
3. dt.style = WS_POPUPWINDOW|DS_MODALFRAME|WS_DLGFRAME;
4. dt.cdit = 3; // # dlg items
5. dt.x = 100; // in dlg units
6. // etc.

DLGTEMPLATE 结构域是自扩展的,对此我不再做进一步说明。紧跟着该结构后面的域是变长域:菜单,对话框类和标题。每一项都不能超过一个 WORD。它可以是一个空结尾的 Unicode 字符串以标示某个 MENU 资源的名字,对话框类名或标题。此外,菜单和类名可以用特殊值 0xFFFF 后跟一个 16位 的 ID――即可以是菜单资源的 ID,也可以是预定义系统窗口类的序数。在大多数情况下,类名都应该使用 0x0000(空串),它告诉 Windows 操作系统使用默认的对话框类(#32770)。多数对话框都没有菜单,所以菜单也是 0x0000(空串)。在代码中是这样写的:

1. *pTempl++ = 0; // 菜单 (无)
2. *pTempl++ = 0; // 对话框类 (使用标准的对话框类)

接下来是标题,一个空结尾的 Unicode 字符串:

1. USES_CONVERSION;
2. LPCWSTR wszText = T2W(_T("My Dialog"));
3. wcscpy((WCHAR*)pTempl, wszText);
4. pTempl += wcslen(wszText)+1;

这段代码支持 Unicode 或者 ASCII,因为定义了 _UNICODE,T2W是一个串转换宏。不要忘了增加模板指针 pTempl 的增量值,将其指到串后面的下一个 WORD。如果对话框具有 DS_SETFON 式样,在第四个字段:16位的字体大小后跟 Unicode 字体名,例如:“Verdana”。

最后,我要指出对话框模板有一个扩展版本 DLGTEMPLATEEX,它可以让你指定更多的域,如字体点数和重量、是否用斜体、字符集、字体名。想了解更多信息请参考文档。这里我仅描述一个简单版本,因为通过在 OnInitDialog 处理例程中调用 SetFont 来设置字体是很容易的事情。(对于对话框中的控件项也有一个 DLGITEMTEMPLATEEX 扩展版本)。

讲了这么多 DLGTEMPLATE。下面该看看控件。对话框中的每个控件项都是通过一个模板来描述的(DLGITEMTEMPLATE),其值不能超过一个 DWORD:

1. pTempl = AlignDWORD(pTempl);
2. DLGITEMTEMPLATE& it = *((DLGITEMTEMPLATE*)pTempl);
3. it.x = 0;
4. it.y = 0;
5. // etc.

与 DLGTEMPLATE 类似,DLGITEMTEMPLATE 结构后面有三个变长域。即类名,文本和“”创建数据(creation data)。类名也是空结尾的 Unicode 字符串指定窗口类名(例如,“SysListView32”或者“MyFancyControl”),或者 0xFFFF 后跟特定的原子码之一,这些编码如 Figure 4 所示,它们都用于标准的预定义系统控件。例如,下面的代码示范了如何创建一个静态的文本控件:

CodeControl Type
0x0080Button
0x0081Edit
0x0082Static
0x0083List box
0x0084Scroll bar
0x0085Combo box
1. // class immediately after DLGITEMTEMPLATE
2. *pTempl++ = 0xFFFF; // next WORD is atom:
3. *pTempl++ = 0x0082; // static control

类名后面是标题。它既可以是 Unicode 字符串,也可以是特定的 0xFFFF 后跟 16位的资源 ID。你还可以用 0xFFFF + ID 的格式来为某个具备 SS_ICON 或 SS_BITMAP 式样的静态控件指定一个图标或位图。CStringDialog 使用字符串形式来创建其提示:

1. USES_CONVERSION;
2. LPCWSTR wszTest = T2W(_T("My Dialog"));
3. int maxlen = /* don''t overflow! */
4. wcsncpy((WCHAR*)pTempl, wszText, maxlen); pTempl += wcslen(wszText)+1;

最后,“creation data”可以是任何你想要的数据。第一个 WORD 是数据长度,如果没有数据,其值可以是零。Windows 用 LPARAM 将一个指向数据的指针传递给 WM_INITDIALOG(模式对话框)或者 WM_CREATE(无模式对话框)。在此我不推荐使用创建数据,因为将任何你想要的数据成员添加到对话框类中,并用对话框的构造函数或 OnInitDialog 处理例程初始化它们的做法要容易得多。但你仍然得提供一个 0 WORD 来告诉 Windows 没有创建数据:

1. *pTempl++ = 0; // no creation data

一旦你填充完指定的 DLGITEMTEMPLATE 数据,便可如法炮制下一个对话框控件,直到完成所有的控件。接着确保 DLGTEMPLATE::cdit 指定正确的控件总数。为了简化建立对话框模板的过程(使之尽量少出错)。我写了一个辅助类,CDlgTemplateBuilder。CStringDialog 用这个类可以一步到位建立对话框:

1. // in CStringDialog::Init
2. CDlgTemplateBuilder& dtb = m_dtb;
3. DLGTEMPLATE* pTempl = dtb.Begin(...);
4. dtb.AddItem(...);
5. dtb.AddItem(...);
6. dtb.AddItem(...);
7. InitModalIndirect(pTempl, ...);

我已将细节模糊而突出主要思路:调用一次 Begin,然后针对每个控件调用一次 AddItem。CDlgTemplateBuilder::Begin 生成 DLGTEMPLATE 并且每次调用 AddItem 生成另一个 DLGITEMTEMPLATE。CDlgTemplateBuilder 在自己的内存缓冲里生成模板并在每次添加控件时自动增加 DLGTEMPLATE::cdit(控件项数目)。CDlgTemplateBuilder 具备辅助函数 AlignDWORD 和 AddText 以确保数据对齐和实现正确的字符串转换。有关细节自己下载源代码细细琢磨吧。

我前面说过对话框使用对话框单位,而非像素。DLGTEMPLATE 和 DLGITEMTEMPLATE 两个都包含 x,y,cx h和 cy 成员来指定对话框或控件项的位置和大小。这些值都是对话框单位。每个水平方向的对话框单位是四分之一的基本单位,而每个垂直方向的对话框单位是八分之一的基本单位。一个基本单位是对话框中一个字符宽度和高度的平均值,并且依赖于对话框的字体。是不是很痛苦啊!没错,但凭心而论,这个想法是值得赞誉的:对话框单位使你的对话框外观独立于其字体。所以不管你用大字体也好,小字体也好,所有控件的相对位置是不会变的,一切都显示正常。Windows 有一个特别的函数叫做 MapDialogRect,用来将对话框单位转换为像素;令人惊讶的是却没有反向转换函数,而这正是生成模板所需要的――但你可以用如下公式:

1. CSize base = ::GetDialogBaseUnits();
2. xDlg = MulDiv(xPixel, 4, base.cx);
3. yDlg = MulDiv(yPixel, 8, base.cy);

对于 CStringDialog 来说,我懒得去做这些事情,而是试验性找到正确的值显示出如图 Figure 1 所示的对话框。更复杂的实现得检查提示串的长度,或允许调用这指定尺寸。如果处理这些对话框单位让你头痛,那么你就创建大小和位置都是 0 的控件得了,然后实现 OnSize  处理例程将控件移到适合的像素位置。你的对话框得从 OnInitDialog 向自身发送 WM_SIZE 消息以确保第一次显示时控件被正确定位。

最后,我是如何让 CStringDialog 显示如 Figure 1 所示的问号的呢?CStringDialog::Init 让你指定提示图标。默认是 IDI_QUESTION。但 IDI_QUESTION 是一个内建的图标,不是来自应用程序资源文件的图标。如果你指定一个对话框模板中的资源 ID,Windows 期望它在资源文件中。那么我如何让 Windows 改用系统图标呢?

当然,话虽如此,CStringDialog 检查图标资源 ID,看看值是否大于 IDI_APPLICATION,也就是第一个系统图标的 ID。如果该图标 ID 在系统 ID 范围之内,CStringDialog 通过调用 ::LoadIcon 来加载它,此时 hInstance 置为 NULL(用于系统图标)并在 数据成员 m_hIcon 中保存加载的 HICON。然后 CStringDialog用 0xFFFF + nResID 格式(nResID=0)来构造对话框模板。这导致 Windows 创建一个静态图标,但并非实际的图标,然后,CStringDialog 在 OnInitDialog 中才设置实际图标:

1. // in CStringDialog::OnInitDialog()
2. if (m_hIcon) {
3. CStatic* pStatic = (CStatic*)GetDlgItem(IDICON);
4. pStatic->SetIcon(m_hIcon);
5. }

这样一来,你可以将任何 IDI_XXX 形式的图标 IDs 传递给 CStringDialog::Init。你还能用自己的图标,只要其 ID 小于 IDI_APPLICATION = 32512。具体细节请参考源代码。

我最近要写一个正则表达式的 DDV 确认程序,正巧你写了一个(参见 2005 四月刊)。想知道为什么你要包装 .NET 库,这样无端地添加了许多依赖性(包装库累赘),为什么不用 Visual Studio .NET 里现成而简洁的正则表达式库,你只要包含一个头文件便可以在你的 MFC 程序中使用它,atlrx.h?虽然它不是百分百标准的语法,但我宁愿用它而不愿添加对 .NET 框架的依赖。

Gil Rosin

将我一军还要朝我拍砖!我甚至都不知道 ATL 有一个 regex 类。Windows 的东西太多,即使你是一个高手,也不一定就知道的那么全。没错,你说得很对,ATL 确实提供了一个 regex 实现!

首先,让我来更正一下人们关于 .NET 框架的一些印象。我知道很多人在应用程序中添加这样的依赖性时都非常勉强,因为害怕代码臃肿,我刚开始也是这样。但是使用 .NET 框架也许并不像你想像的那么糟。虽然托管应用在启动时明显感觉性能问题,但不管你信不信,一旦框架被加载之后,微软中间语言(MSIL)代码甚至可以运行得比本机 EXEs 还快。那是因为 JIT (即时)编译器真的能进行许多性能优化。虽然一些面向老版本 Windows 如 Windows 98 或 Windows NT 的应用不一定有现成的框架环境,你得自己安装(参见“Using Visual Studio .NET 2003 to Redistribute the .NET Framework”或在 google 上搜索“dotnetfx.exe”),但较新的以及未来的 Windows 版本都会将预装框架环境。随着 .NET 框架越来越普及,其性能也会得到不断的改进,调用框架所产生的额外成本(性能和安装方面)将会降至最小。

对于我的包装库,其实要说它的“累赘”,只不过是一层使之能编译的薄薄糖衣。顶多添加了一个额外的函数调用,因为每个包装器对象只是一个托管对象句柄。正像我在四月份的文章(“Wrappers: Use Our ManWrap Library to Get the Best of .NET in Native C++ Code”)中所指出的那样,函数调用对于大多数应用程序来说无关紧要。此外,我之所以选择 regex,只是以此为例;我的主要目的是创建一种通用机制来包装任何框架类。最终,如果你使用的是老版本编译器不支持 /clr,或者出于某种原因想避免使用 /clr,那么你只需要用包装器即可。要不然就撇开包装器,直接通过托管扩展调用框架。

现在我已经消除了误解,我必须承认,当我得知 ATL 模板库有一个 regex 类后,尽管我的孤陋寡闻使我有些忐忑不安,但我还是十分兴奋的。当我收到你的 e-mail 后做的第一件事情是将测试程序从使用 .NET 库的 ManWrap 移植到 ATL。我想看看是不是很容易做到。我碰到了一些小麻烦,但没有费什么周折就解决了。

与 .NET 框架相比,ATL 实现的 regex 比较原始,但它在多数情况下表现不错。ATL 使用两个模板类:一个是 CAtlRegExp,用于操作正则表达式;另一个是 CAtlREMatchContext,用于处理匹配。这两个模板由另一个描述字符集特性(例如,ASCII,WCHAR 或多字节)的类参数化。在实际应用中,你可以将此忽略掉,因为 ATL 模板根据你对 _UNICODE 的设置提供默认的字符集特性 CAtlRECharTraits:

1. // in atlrx.h
2. #ifndef _UNICODE
3. typedef CAtlRECharTraitsA CAtlRECharTraits;
4. #else
5. typedef CAtlRECharTraitsW CAtlRECharTraits;
6. #endif
7. template
8. class CAtlRegExp; // forward declaration

从效果上讲,所有的 ATL regex 默认使用 TCHARs。所以在 ATL 中要创建正则表达式可以这样写:

1. CAtlRegExp<> re;
2. re.Parse("a+b+");

它将正则表达式解析为内部结构,这样一来你便可以用 CAtlREMatchContext 调用 Match 来得到匹配:

1. CAtlREMatchContext<> mc;
2. re.Match("aaabbx", &mc);

与框架的 regex 类以及其它更成熟的实现相比,CAtlREMatchContext 多少土气一些。它有一个数据成员 m_Match,类型为 MatchGroup 结构,用于保存匹配的开始和结尾:

1. struct MatchGroup {
2. const RECHAR *szStart;
3. const RECHAR *szEnd;
4. };

此处 RECHAR 可以是任何在字符集中定义的字符类型;在实际应用中,如果使用的是默认的字符集,则它与 TCHAR 相同。CAtlREMatchContext 还可以在输入字符串中查找匹配的子分组。调用 Match 之后,mc.m_uNumGroups 保存匹配子分组的数目,你可以调用 GetMatch(i,...)来获得第 i 个子分组匹配。ATL 正则表达式的一个不可思议的事情之一是它使用花括弧来表示分组,而不是标准的圆括弧。例如:

1. CAtlRegExp<> re;
2. re.Parse("{a+}{b+}");
3. re.Match("aaabbx", &mc);

这段代码将找到一个匹配(“aaabb”),两个分组(“aaa”和“bb”)。ATL 会匹配常规的父分组,但你无法找到单独的子匹配,除非你使用花括弧。

CAtlRegExp 和 CAtlREMatchContext 在使用上显得有些笨拙。例如,为了找到所有匹配,你得用前一次匹配的 szEnd 指针作为下一个输入串的开始重复调用 Match。又不是研究火箭,为什么必须跟踪状态才能快速找到想要的所有匹配?于是我用一个简单的类 CRegex 对细节进行了封装,使编程更容易一些。主要的头文件如 Figure 5 所示,Figure 6 是我四月份文章中关于 ManWrap 的 RegexTest 程序,已经移植到 ATL。最初的程序是输入正则表达式和字符串,RegexTest 显示匹配和分组。它用 CRegex 来遍历匹配:

01. Figure 5 Regex.h
02.  
03.
04. // MSDN Magazine — August 2005
05. // If this code works, it was written by Paul DiLascia.
06. // If not, I don't know who wrote it.
07. // Compiles with Visual Studio .NET 2003 (V7.1) on Windows XP. Tab size=3.
08. //
09. #pragma once
10. #include             // ATL regex
11. using namespace std;
12.  
13. //
14. // CRegex makes ATL regular expressions a little more usable.
15. //
16. class CRegex : public CAtlRegExp<> {
17. protected:
18. CString m_re;              // the regular expression
19. BOOL m_bCaseSensitive;      // case sensitive?
20. CAtlREMatchContext<> m_mc;  // internal ATL match context
21. LPCTSTR m_szIn;             // original input string
22. LPCTSTR m_szNext;           // next character to search
23.  
24. // helper to extract string from ATL MatchGroup
25. CString GetMGString(const CAtlREMatchContext<>::MatchGroup& mg);
26.  
27. public:
28. REParseError m_err;         // current ATL parse error, if any
29.  
30. // helper function to get error name from error code
31. static LPCTSTR GetErrorName(REParseError err);
32.  
33. CRegex() : m_err(REPARSE_ERROR_OK) { }
34. CRegex(LPCTSTR szRE, BOOL bCaseSensitive=TRUE) {
35. m_err = Parse(szRE, bCaseSensitive);
36. }
37. CRegex(const CRegex& r) { *this = r; }
38. ~CRegex() { }
39.  
40. // only copy Regex and case flag, not dynamic state—then reparse
41. const CRegex& operator= (const CRegex& r) {
42. m_re = r.m_re;
43. m_bCaseSensitive = r.m_bCaseSensitive;
44. if (!m_re.IsEmpty())
45. m_err = Parse(m_re, m_bCaseSensitive);
46. return *this;
47. }
48.  
49. // convert to string: return RE
50. operator LPCTSTR() const return m_re; }
51.  
52. // Parse RE: reset internal state and return error code.
53. REParseError Parse(LPCTSTR szRE, BOOL bCaseSensitive=TRUE) {
54. m_re = szRE;
55. m_szIn = m_szNext = NULL;
56. return CAtlRegExp<>::Parse(szRE, bCaseSensitive);
57. }
58.  
59. // Set input string. Use this with NextMatch to find all matches.
60. void SetInput(LPCTSTR szIn) {
61. m_szIn = m_szNext = szIn;
62. }
63.  
64. // Find next match after calling SetInput
65. BOOL NextMatch() {
66. return CAtlRegExp<>::Match(m_szNext, &m_mc, &m_szNext);
67. }
68.  
69. // Find a single match in input string.
70. BOOL Match(LPCTSTR szIn, LPCTSTR* ppszEnd=NULL) {
71. if (szIn==NULL || *szIn==0)
72. return FALSE;
73. SetInput(szIn);
74. return CAtlRegExp<>::Match(szIn, &m_mc, ppszEnd);
75. }
76.  
77. // Get current match; optional arg returns offset in input string.
78. CString GetMatch(int* pOffset=NULL) const {
79. if (pOffset)
80. *pOffset = (int)(m_mc.m_Match.szStart - m_szIn);
81. return GetMGString(m_mc.m_Match);
82. }
83.  
84. // Get number of groups. In ATL syntax, groups are marked with {}.
85. UINT GetNumGroups() const return m_mc.m_uNumGroups; }
86.  
87. // Get nth match group. Optional arg returns offset into input string.
88. CString GetGroup(int nIndex, int* pOffset=NULL) const {
89. CAtlREMatchContext<>::MatchGroup mg;
90. const_cast< CRegex*>(this)->m_mc.GetMatch(nIndex, &mg);
91. if (pOffset)
92. *pOffset = (int)(mg.szStart - m_szIn);           
93. return GetMGString(mg);
94. }
95. };
1. CRegex re(/* regex */);
2. re.SetInput(/* input */);
3. while (re.NextMatch()) {
4. int offset=0;
5. CString match = re.GetMatch(&offset);
6. ...
7. }

CRegex 构造函数自动调用 Parse(你应该检查 m_err 看看是否出错),如果你想要单独分组匹配,可以调用 CRegex::GetNumGroups 来获取当前匹配的分组总数,调用 CRegex::GetGroup 获得每个分组匹配。具体细节如 Figure 7 所示。CRegex 在内部有其自己的 CAtlRegExp 和 CAtlREMatchContext 对象,并对其在输入串中位置进行跟踪――不必自己去做!

01. Figure 7 FormatResults.cpp
02.  
03. CString FormatResults(CString sRegex, CString sInput)
04. {
05. if (sRegex.IsEmpty())
06. return errbeep(_T("Please enter a regular expression!"));
07. if (sInput.IsEmpty())
08. return errbeep(_T("Please enter an input string!"));
09.  
10. CString result;
11. CString temp;
12.  
13. CRegex re(sRegex);
14. if (re.m_err!=REPARSE_ERROR_OK) {
15. result.Format(_T("Oops! Error parsing regex: %s\n"),
16. re.GetErrorName());
17. MessageBeep(0);
18. return result;
19. }
20.  
21. LPCTSTR szInput = sInput;
22. int count=0;
23. re.SetInput(szInput);
24. while (re.NextMatch()) {
25. int offset=0;
26. CString match = re.GetMatch(&offset);
27. temp.Format(_T("Match at %d: %s\n"), offset, match);
28. result += temp;
29.  
30. temp.Format(_T(" Number of groups: %d\n"), re.GetNumGroups());
31. result += temp;
32.  
33. UINT nGroups = re.GetNumGroups();
34. for (UINT m=0; m< nGroups; m++) {
35. CString group = re.GetGroup(m, &offset);
36. temp.Format(_T(" Group %d at %d: %s\n"), m, offset, group);
37. result += temp;
38. }
39. count++;
40. }
41. if (count<=0)
42. result.Format(_T("No match!"));
43.  
44. return result;
45. }

Figure 6 RegexTest 运行画面

我还添加了几个有用的特性,ATL 没有 regex Replace 函数,但添加一个并不难。有了框架的 regex 类,CRegex::Replace 得来全不费功夫,函数静态,这样你用不用 CRegex 对象调用都可以。例如,RegexTest 的主对话框使用静态版本来将新行(\n)转换为回车换行 CRLF(\r\n):

1. static CString LF2CRLF(LPCTSTR lpsz)
2. {
3. return CRegex::Replace(lpsz,_T("\n"),_T("\r\n"),TRUE);
4. }

就这么简单,如果没有 CRegex,直接用 CAtlRegExp 要数行代码才能做到。当你在微软的基本构件块上花点时间来做高层次的抽象,你就会出效率。这就是分层设计的本质所在。我甚至添加了一个与 .NET 框架类似的动态 Replace 函数,以便能用回调函数来实现动态替换算法,就像我四月份文章中 WordMess 程序所做的那样。最后,我添加了 Split,以便你能用正则表达式作为分隔符将某个字符串剥离到一个子串数组中。例如:

1. vector strs = CRegex::Split("one,two,three",",");

它返回有三个子串的向量数组:“one”,“two”,“three”。Split 的实现主要是字符串处理功夫,不过一旦你写就了代码,它就是你的并且永远受用。具体细节去参考源代码吧。

如果你决定使用 ATL 正则表达式或我封装的 CRegex,请谨慎:ATL 版本的正则比表达式是一个简化的,非标准的实现。我已经提到过它使用花括弧而不是圆括弧。ATL 还使用非标准的元字符(例如,用 \b 而不是 \s 表示空格),并且你无法在表示范围时([\a\d]不工作)使用元字符。特殊字符清单参见 Figure 8。请仔细阅读文档,提防 bug。复杂的正则表达式并不是总能凑效,你需要 #pragma 来抑制两个四级编译器警告(具体细节参见代码)。但如果你只需要一些基本的模式匹配来对用户输入进行有效性检查,ATL 是可以胜任的。

Abbrev.Matches
\aAny alphanumeric character: ([a-zA-Z0-9])
\bWhite space (blank): ([ \\t])
\cAny alphabetic character: ([a-zA-Z])
\dAny decimal digit: ([0-9])
\hAny hexadecimal digit: ([0-9a-fA-F])
\nNewline: (\r|(\r?\n))
\qA quoted string: (\"[^\"]*\")|(\'[^\']*\')
\wA simple word: ([a-zA-Z]+)
\zAn integer: ([0-9]+)

结束本文之前,我想告诉 C++ fans 们正则表达式不日将肯定成为标准模板库的一部分。其实现很可能是基于 boost 的实现,你可以从 boost.org 得到它。

祝编程愉快!

您的提问和评论可发送到 Paul 的信箱:cppqa@microsoft.com.

作者简介

Paul DiLascia 是一名自由作家,顾问和 Web/UI 设计者。他是《Writing Reusable Windows Code in C++》书(Addison-Wesley, 1992)的作者。通过 http://www.dilascia.com 可以获得更多了解。  

本文出自 MSDN Magazine 的 August 2005 期刊,可通过当地报摊获得,或者最好是 订阅

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Regex Testor Version 1.02 Copyright (c) 2013 Fiery Red - flameleo 我们在使用正则表达式( regex: regular expression )的过程中,经常发现正则表达式的语法很令人头疼,即使对经常使用它的人来说也是如此。对于刚接触正则表达式的人来说多练习,多使用,才能熟练掌握正则表达式。 由于难于读写,容易出错,且需要反复练习。所以找一种工具对正则表达式对我们脑中构思的regex进行测试是很有必要的。 1.特点 a.适合初学者,在不断测试用学习如何使用正则表达式。 b.可以分组保存,测试中用到的正则表达式。 c.本工具使用最常见的regex。以下是简单示例: a|b Matches a or b gr(a|e)y Matches a or e . Matches any single character [abc] Matches a single character a, b or c [^abc] Matches any single character except a, b or c [a-z] Matches a single charactor in the range a to z [a-zA-Z] Matches a single charactor in the range a to z or A to Z ^ Matches the start of the filename $ Matches the end of the filename * Matches the preceding element zero or more times ? Matches the preceding element zero or one times + Matches the preceding element one or more times {x} Matches the preceding element x times {x,} Matches the preceding element x or more times {x,y} Matches the preceding element between x and y times 值得一提的是()代表子匹配,有些环境中gr(a|e)y Matches gray or grey 还支持许多常见的转义字符 \b,\B,\c,\d,\D,\f,\n,\r,\s,\S,\t,\v,\w,\W,\x,\u 具体详见附件 Regular Expression Syntax1.html 2.功能介绍 a.界面上显示提供regex输入框和原文本框,点击[模式匹配]按钮后,会在右侧输出结果,包括匹配字符串列表和文本。 b.对于测试中一些有用的regex,点击[insert]按钮添加到模式列表,以备日后使用。你可以位该regex添加描述分组,该信息会在程序结束后保存在CustomPatternInfo.ini文件中。 c.可以参考Readme_1.jpq和Readme_2.jpq图片介绍。 3.有待改进 a.界面布局和控件友好型和交互性。 b.界面功能提供regex语法支持。(暂时可以通过导入附件RegexSystax.ini到CustomPatternInfo.ini中) 4.意见反馈 a.请将您的宝贵意见反馈到 FieryRed_2012@163.com 附件: Readme.txt Readme_1.jpg Readme_2.jpg Regular Expression Syntax.html RegexSystax.ini
import java.util.TreeSet; import java.util.regex.Matcher; import java.util.regex.Pattern; class RegexTest { public static void main(String[] args) { checkMail(); StringReplace(); ipSort(); getNumber(); } /* * 需求: 对邮件地址进行校验,判断给出的mail是否是合法的邮箱地址 */ public static void checkMail() { String mail = "abc12@sina.com"; String mailRegex = "[a-zA-Z0-9]+@[a-zA-Z0-9]+(\\.[a-zA-Z]+)+"; Pattern pattern = Pattern.compile(mailRegex); Matcher matcher = pattern.matcher(mail); if (matcher.matches()) { System.out.println(mail + " is a valid email address."); } else { System.out.println(mail + " is not a valid email address."); } } /* * 需求: 将下列字符串转成:我要编程 */ public static void StringReplace() { String str = "我我...我我..我...我要..要要..学学学学...学学..编...编程程"; String replaceStr = str.replaceAll("[^我要编程]", ""); System.out.println(replaceStr); } /* * 192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.30 将ip地址进行地址段的顺序排序 * 还按照字符串自然顺序,只要让它们每一段都是3位即可 1,按照每一段需要的最多的0进行补齐 那么每一段就会至少保证有3位 2,将每一段只保留3位 这样,所有的ip地址都是每一段3位 */ public static void ipSort() { String ip = "192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.30"; TreeSet<String> set = new TreeSet<String>(); String[] ips = ip.split(" "); for (String s : ips) { String[] nums = s.split("\\."); StringBuilder sb = new StringBuilder(); for (String num : nums) { sb.append(String.format("%03d", Integer.parseInt(num))); } set.add(sb.toString()); } for (String s : set) { StringBuilder sb = new StringBuilder(); for (int i = 0; i < s.length(); i += 3) { sb.append(Integer.parseInt(s.substring(i, i + 3))).append("."); } sb.deleteCharAt(sb.length() - 1); System.out.println(sb.toString()); } } /* * 提取数字 */ public static void getNumber() { String string = "12334我的QQ是: 456456 我的电话是:0532214我的邮箱是:123:aaa@aaa.com"; String regex = "\\d+"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(string); while (matcher.find()) { System.out.println(matcher.group()); } } }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值