爬虫是正则表达式的第二种应用(第一种是校验字符串)。
1.如何在本地文本中爬取信息
1.m.find()为在str中是否有满足“Java\\d{0,2}”条件的,如果有则返回true并记录其下标。再次调用find方法是会从上一个find方法记录的下标开始。
2.group()方法是获得find方法记录的下标的值。
2.贪婪爬取及非贪婪爬取
1.贪婪爬取就是尽可能更多的获取数据,非贪婪爬取反之就是尽可能获取少的数据
2.Java当中默认为贪婪爬取
例如:(此代码为贪婪爬取也就是默认)
2.非贪婪爬取只需将regex = “ab+”改为regex = “ab+?”。