正则表达式:
在java中,两个\才表示\,所以使用时需要用\\ ;
在API文档的Pattern类中可以查询;
用小括号()可以分组;
(?i)可以忽略后面的大小写,如下:
可以忽略bc的大小写;
爬虫:
本地爬取:
m.find()方法用来查找(指针查找),m.group()方法用来返回查找到的字符串;
当find方法查找到字符串末尾时跳出循环;
网络爬取:
有条件的爬取:
在输出时只会输出前面的Java;
如果是?: 会在获取的时候获取全部内容;
如果是?! 会去除!后面这份数据,获取其他?的内容;
贪婪爬取和非贪婪爬取:
正则表达式在字符串方法中的使用:
正则表达式的捕获分组:
捕获分组用于需要使用前面的内容;
非捕获分组:
这样做不占用组号;