php正则表达式经典实例,PHP基础-PCRE(正则表达式)匹配中文最权威汇总-北漂者...

首先,PCRE你真的认识它吗?

PCRE(Perl Compatible Regular Expressions中文含义:perl语言兼容正则表达式)是一个用C语言编写的正则表达式函数库,由菲利普.海泽(Philip Hazel)编写。PCRE是一个轻量级的函数库,比Boost之类的正则表达式库小得多。PCRE十分易用,同时功能也很强大,性能超过了POSIX正则表达式库和一些经典的正则表达式库。

从本质上再一次认识它,下面就总结一下,在正则表达式使用中,常见的误区和混淆:

正则表达式做的就是根据实际的需求去匹配内容,这一特点,让它更多的用于一些非正规网站的文章采集,当然不排除在采集过程中对正则表达式的技术性要求。

另外的一个用途是简单的验证,在此?重点讲解一下验证码在验证中文的使用,其他的都是常用原子的运用,自己积累吧:

在这里有很多的网站资料都是一样的,可能就是一篇文章转来转去,害人害己,多的不说了,开始讲干货!

首先是PHP中的匹配:

//正宗的匹配中文的正则表达式

$pattern = '/[^u4E00-u9FA5]+/';//其中的英文字母不区分大小写

/*其中u4E00-u9FA5等价于    p{InCJK_Radicals_Supplement}p{InKangxi_Radicals}p{InIdeographic_Description_Characters}p{InCJK_Symbols_and_Punctuation}p{InHiragana}p{InKatakana}p{InBopomofo}p{InHangul_Compatibility_Jamo}p{InKanbun}p{InBopomofo_Extended}p{InKatakana_Phonetic_Extensions}p{InEnclosed_CJK_Letters_and_Months}p{InCJK_Compatibility}p{InCJK_Unified_Ideographs_Extension_A}p{InYijing_Hexagram_Symbols}p{InCJK_Unified_Ideographs}

所以正则表达式还可以写成:

*/

$pattern = '/[^p{InCJK_Radicals_Supplement}p{InKangxi_Radicals}p{InIdeographic_Description_Characters}p{InCJK_Symbols_and_Punctuation}p{InHiragana}p{InKatakana}p{InBopomofo}p{InHangul_Compatibility_Jamo}p{InKanbun}p{InBopomofo_Extended}p{InKatakana_Phonetic_Extensions}p{InEnclosed_CJK_Letters_and_Months}p{InCJK_Compatibility}p{InCJK_Unified_Ideographs_Extension_A}p{InYijing_Hexagram_Symbols}p{InCJK_Unified_Ideographs}]/';

//两个表达式是同样的效果

//还有一种,这个是匹配任何双字节字符的,不但是中文

$pattern = '/[^\x00-\xff]/';

admin84

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在LabVIEW中,可以使用正则表达式匹配中文汉字。LabVIEW以支持PCRE(Perl Compatible Regular Expressions)语法,并具有相应的函数来处理正则表达式。 首先,在LabVIEW的Block Diagram中,选择适当的函数,例如"Match Regular Expression"函数。然后,创建一个正则表达式,用于匹配中文汉字。中文汉字的Unicode编码范围是[\u4e00-\u9fa5],因此我们可以使用"[\u4e00-\u9fa5]+"来匹配一个或多个中文汉字。 接下来,我们需要将要匹配的字符串输入到正则表达式函数中。可以使用字符串常量或者将字符串变量传递给该函数。 最后,我们可以使用其他的LabVIEW函数,例如"Match Result"函数来获取匹配结果。这将返回匹配的字符串以及匹配的位置等信息。 需要注意的是,在使用LabVIEW进行正则表达式匹配时,可能会遇到一些编码问题。确保所用的字符串编码与文本编码一致,例如UTF-8编码。可以使用LabVIEW的字符串操作函数对字符串进行编码转换。 综上所述,LabVIEW可以使用正则表达式匹配中文汉字。通过选择正确的函数,创建合适的正则表达式,并处理可能遇到的编码问题,可以有效地在LabVIEW中进行中文汉字的匹配。 ### 回答2: 在LabVIEW中使用正则表达式匹配中文汉字的方法如下: 1. 首先,将需要匹配的文本数据传入LabVIEW的字符串变量中。 2. 使用正则表达式匹配函数Cluster Match Pattern,该函数位于LabVIEW的字符串函数库中。设置正则表达式的输入,以匹配中文汉字的Unicode编码范围。 3. 正则表达式的输入可以使用Unicode编码来匹配中文汉字,使用\p{IsHan}表示中文汉字字符。具体的正则表达式如下所示:\p{IsHan} 4. 将匹配的结果传入到另一个字符串变量中。 5. 最后,根据匹配结果进行相应的操作,例如显示匹配中文汉字结果或者进行其他的处理。 需要注意的是,LabVIEW的正则表达式匹配函数由于采用的是Perl风格的正则表达式语法,与传统的常规正则表达式语法存在略微的差异。在使用过程中,可能需要根据实际需求进行一些调整和适配。 总之,通过LabVIEW的正则表达式匹配函数,我们可以实现对中文汉字的匹配和处理。 ### 回答3: 在LabVIEW中,可以使用正则表达式匹配中文汉字。 首先,在LabVIEW中,我们可以使用"正则表达式.vi"这个内置的函数来实现正则表达式匹配功能。这个函数可以根据输入的正则表达式模式,对一个字符串进行匹配操作。 接下来,如果我们想要匹配中文汉字,可以使用Unicode的特性来实现。每个中文汉字都对应一个Unicode码点,我们可以借助这个码点来进行匹配。 比如,要匹配一个字符串中的中文汉字,可以使用"\\p{Script=Han}"这个正则表达式模式。这个模式会匹配任意一个中文汉字。 在LabVIEW中,我们可以将这个正则表达式模式作为输入,传给"正则表达式.vi"这个函数,然后再将要匹配的字符串作为输入传给该函数。函数运行后,如果匹配成功,就可以得到匹配到的中文汉字。 需要注意的是,LabVIEW对正则表达式的支持相对较弱,可能不支持某些高级的正则表达式语法。如果遇到复杂的匹配需求,可能需要使用其他编程语言或工具来实现。 总之,LabVIEW中可以使用正则表达式匹配中文汉字,可以通过传递特定的正则表达式模式实现匹配操作,从而得到匹配到的中文汉字。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值