正则表达式
文章平均质量分 65
AirTesla
这个作者很懒,什么都没留下…
展开
-
正则表达式中的结构
正则表达式中的结构字符表示法 字符缩略表示法:\n,\t,\a,\b,\e,\f,\r\,\v 八进制转义:\num 控制字符:\cchar字符组及相关结构普通字符组:[a-z][^a-z]任何字符:.字符组缩略:\w,\d,\s,\W,\D,\S锚点及其他“零长度断言”行、字符串起点:^,\A行,字符串终点:$,\z,\Z本次匹配开始的位置(或上次匹配结束的位置):\G单词分界符原创 2017-03-08 20:27:16 · 842 阅读 · 0 评论 -
正则表达式引擎——普适规则
两条普适规则规则1:优先选择最左端匹配结果规则2:标准两次优先匹配规则1因由:正则表达式匹配文本时候,总是从最左边的字符开始逐个匹配,从当前位置测试整个表达式能匹配的文本,如果不能匹配,则从下一个字符开始重新尝试。 例子1: 正则表达式: cat 文本:it indicates that your cat is too fat. 匹配结果: ind原创 2017-03-17 15:42:49 · 954 阅读 · 0 评论 -
正则表达式——文本定位
正则表达式 文本定位: 环视(lookaround)——不匹配字符串,仅仅匹配文本中特定位置 顺序环视: 肯定型顺序环视:如(?=\d),当前位置右侧是数字则匹配成功原创 2017-03-07 10:15:44 · 2211 阅读 · 0 评论 -
正则表达式—解析CSV文件
不同程序有不同的CSV格式,微软CSV格式文件中得到格式是用逗号将不同的字段进行分割,或者当字段包含逗号时候用双引号分割,举例如下:一、微软CSV格式匹配【文本】 your dollors,10000, 27 years old ,,”10,000”,”it is “10 Grand”,baby”,10k 这个例子中包含了七个字段,分别是 your dollors 10000 27 yea原创 2017-03-27 18:11:44 · 5066 阅读 · 0 评论 -
NFA灵魂—回溯
回溯的原理:记录所有可能的表达式分支,尝试匹配,若失败则返回,选择上次正确标记处按新的表达式(备用状态)开始新的尝试匹配。可以回溯到特性:优先匹配、忽略优先的匹配、多选结构、环视、条件判断、反向引用、固化分组回溯的两条原则:1、进行尝试:匹配优先量词(?、+、{m, n})2、跳过尝试:忽略优先量词(??、*?)强制回溯时候,执行“后进先出”原则,即从右向左进行回溯 匹配优先 回溯原创 2017-03-09 20:46:21 · 1400 阅读 · 0 评论 -
正则表达式—优化
正则表达式匹配过程1原创 2017-03-28 19:13:40 · 783 阅读 · 0 评论 -
正则表达式常见例子
一、原创 2017-03-24 14:48:21 · 345 阅读 · 0 评论 -
正则表达式—HTML中的匹配
从HTML中文本中提取Email地址和http URL,是在做爬虫时候的经常用到的技术,虽然变成语言本身可以帮助我们找到他们,但是用正则表达式来匹配也是很有用和具有实际意义的方法。原创 2017-03-25 14:22:15 · 7216 阅读 · 0 评论