最近在做人物画像,要对url进行分析、抽取关键值,所以常常写好多正则表达式。记录一下
1. 几种常见的正则符号及区别
- [\w]与[\W]
- [\s]与[\S]
- [\d]与[\D]
- 详情见scala教程http://www.runoob.com/scala/scala-regular-expressions.html
2. 几种常见的量词
- *:表示0次或多次
- +:表示1次或多次
- ?:表示0或1次
3. 贪婪匹配与非贪婪匹配
- http://www.cnblogs.com/xudong-bupt/p/3586889.html
4. ?四种使用方法
- 环视
- http://www.cnblogs.com/graphics/archive/2010/06/02/1749707.html
参考资料:
http://www.zjmainstay.cn/my-regexp
注:
1. 要看懂别人写的高大上的正则式,首先要把正则式“肢解”,切入点()、| 等。
2. scala中使用正则和java中不太一样。