![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
正则表达式
jiangtaigong
这个作者很懒,什么都没留下…
展开
-
提取html中的超链接地址
正则表达式不易调试,写起来有趣,读起来烦。就像perl一样!没怎么测试,不过应该凑合能用。主角登场:<a.*?\s+href=\s*"?([^\s">]+)[\s">] 其中[^\s">]最好替换成url字符集,可以防止意外情况出现。 使用的时候要忽略大小写...2008-11-03 18:57:38 · 328 阅读 · 0 评论 -
lookahead和positive lookbehind
下了一本txt格式的小说,发现里面很多不是段落结束的地方竟然用了回车,看着很不爽,立刻祭起Python,想把里面所有的不该出现的回车消除掉。读取文件内容后,顺手写下re.sub(r'[^\n]\n[^\n]', '', content),很简单的一个正则,就是找出单个的换行符并且替换掉。用Java习惯了,因为Java的正则表达式没有lookahead等功能,我也很少时候。做完了想起python是支...2009-05-18 21:54:45 · 194 阅读 · 0 评论 -
各种工具之正则表达式语法比较
转自http://blog.chinaunix.net/u/634/showart.php?id=2466,觉得太好,情不自禁的转过来了以perl的正则为基准,不同的用法以粉红色标出。grep 2.5.1egrep 2.5.1sed 3.02sed 4.07awk 3.1.1perl 5.8.0vim 6.1JavaScript ??转义\\...原创 2010-05-24 19:18:56 · 109 阅读 · 0 评论