正则表达式
正则表达式(Rgular Expression)简介
1. 问什么需要正则表达式?
文本的复杂处理
2. 正则表达式的优势和用途?
一种强大而灵活的文本处理工具
大部分编程语言,数据库,文本编辑器,开发环境都支持正则表达式
3. 正则表达式定义:
描述了一个规则,通过这个规则可以匹配一类字符串
学习正则表达式很大程度上就是在学习正则表达式的语法规则
开发中如何使用?
开发中使用正则表达式的流程:
- 分析要匹配的数据,写出测试用的典型数据
- 在工具软件中进行匹配测试
- 在程序中调用通过测试的正则表达式
工具软件RegexBuddy
正则表达式(1)- 普通字符
- 字母数字下划线以及没有特殊定义的标点符号,都是“普通字符”。
- 表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符:
正则表达式(2)- 标准字符集合
- 能够与‘多种字符’匹配的表达式
- 注意区分大小写,大写是取反得意思
正则表达式(3)- 自定义字符集合
-
[ ] 方括号匹配方式,能匹配方括号中任意一个字符
- 正则表达式的特殊符号,被包含到中括号中,就失去特殊意义,除了 ^, - 之外
- 标准字符集合,除小数点外,如果被包含于中括号中,自定义字符集合将包含该集合。比如:
[\d.-+]将匹配:数字,小数点,-和+
正则表达式(4)- 量词
- 修饰匹配次数的特殊符号
- 匹配次数的贪婪模式(匹配字符越多越好,默认!)
- 匹配次数的非贪婪模式(匹配字符越少越好,修饰匹配次数的特殊符号后再加上一个“ ?”号。
正则表达式(5)- 字符边界
- 本组标记匹配的不是字符而是位置,符合某种条件的位置
- \b匹配这样一个位置:前面的字符和后面的字符不全是\w
正则表达式的匹配模式:
正则表达式(6)- 选择符和分组
反向引用(\nnn)
- 每一对括号( )会分配一个编号,使用括号的捕捉根据左括号( )的顺序从1开始自动编号
- 通过反向引用,可以对分组已捕获的字符串进行引用
正则表达式(7)- 预搜索(零宽断言)
正则表达式(8)- 相关练习题
正则表达式(9)- 常用正则表达式列表
正则表达式(10)- 其他妙用
正则表达式(11)- Java程序使用正则表达式
正则表达式(11)- 获取网页超链接(网页爬虫)
暂不提供!