正则表达式
文章平均质量分 69
justheretobe
pythonic and autotest
展开
-
正则表达式中容易误解的地方
1. \d Any digit\D Any character except a digit\s “whitespace”: space, tab, carriage return, line feed, or newline\S Anything except whitespace\w A “word character”: [A-Za-z0-9_]\W Any char转载 2016-11-13 21:04:48 · 361 阅读 · 0 评论 -
正则表达式全部符号解释
正则表达式全部符号解释字符 描述\ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个 向后引用、或一个八进制转义符。例如,'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置。$ 匹转载 2016-11-13 21:05:58 · 271 阅读 · 0 评论 -
正则表达式匹配中文
转载自换联网方法1:正则匹配中文汉字根据页面编码不同而略有区别:GBK/GB2312编码:[x80-xff>]+ 或 [xa1-xff]+UTF-8编码:[x{4e00}-x{9fa5}]+/u方法2:在vim中,可以使用[^\x00-\x7f]\+来匹配所有中文。它表示非ASCII码的集合,当然表示汉字。这是一种粗略的表示。转载 2016-11-13 21:23:36 · 2984 阅读 · 0 评论 -
正则表达式 %r{}操作符和.*? 表达式的区别
# .*? 和(.*?)表达的都是同一个意思,匹配任意字符,直到碰到第一个后面的表达式#符号 %r{} 可以用来替代正则表达式的边界斜线/xxx/#encoding = utf-8require 'open-uri'test_text = "百度一下,你就知道"url = 'http://www.baidu.com/'page = open(url)text =原创 2016-11-13 21:28:32 · 1550 阅读 · 0 评论