regexp
Lich Howger
这个作者很懒,什么都没留下…
展开
-
84-正则表达式
正则表达式来学一下正则表达式现在我们来一个正则abc.那么abc1abc2abccabcaabc.这些都跟abc.相匹配所以abc.就表示 abc再连接一个字符.可以匹配任意一个字符所以abc加任意一个字符 就是abc.然后 匹配特殊字符.a.\.xml这是什么意思第一个点匹配第二个点匹配然后\.是一个整体,是对.进行转译那么这段的意...原创 2018-11-30 15:51:13 · 99 阅读 · 0 评论 -
85-正则表达式02
匹配邮箱[\w]+@[\w]+\.[\w]+分成5个部分[\w]+ @ [\w]+ \. [\w]+感觉好像没什么问题abc@baidu.comabc123@qq.com但是有些邮箱是这样的abc@abc.aaa.com所以需要修改一下金钱匹配\$\d{3,}\.\d{2}分开几个部分来看\$ \d{3,} \. \d{2...原创 2018-11-30 16:25:44 · 108 阅读 · 0 评论 -
86-golang正则表达式
我们在golang中匹配一下正则表达式func main() { str := "abc acc bbc acc adc" //匹配正则表达式 reg := regexp.MustCompile("a(.)(c)") //尝试匹配,后面的数字表示要找几个,1就是1个,-1是查找全部 submatch := reg.FindAllStringSubmatch(str, ...原创 2018-11-30 17:15:28 · 192 阅读 · 0 评论 -
87-正则的贪婪匹配和惰性匹配
正则的贪婪和惰性我们举个例子我们来一段代码func main() { str := "abc acc bbc acc adc" reg := regexp.MustCompile("a(.+)c") submatch := reg.FindAllStringSubmatch(str, -1) fmt.Println(submatch)}执行结果是[[a...原创 2018-12-01 11:01:57 · 300 阅读 · 0 评论 -
88-爬虫爬取span信息
我们在爬取网页之后有大量的无用的信息所以我们需要用正则表达式去筛选一下我们先来试试普通爬取var channel = make(chan bool)func main() { startSpider(1, 5)}func startSpider(start int, end int) { for i := start; i <= end; i++ { ...原创 2018-12-01 16:03:45 · 4988 阅读 · 0 评论 -
89-爬虫爬取电影信息
我们来爬取豆瓣电影的信息先看urlhttps://movie.douban.com/top250?start=0&filter=https://movie.douban.com/top250?start=25&filter=https://movie.douban.com/top250?start=50&filter=然后我们来写一下正则匹配...原创 2018-12-01 16:07:47 · 924 阅读 · 0 评论 -
207-五种不同的邮箱正则
五种不同的邮箱正则 reg, err := regexp.Compile(`^[a-z0-9A-Z]+[- | a-z0-9A-Z . _]+@([a-z0-9A-Z]+(-[a-z0-9A-Z]+)?\\.)+[a-z]{2,}$`) reg, err := regexp.Compile(`^[a-zA-Z0-9_.-]+@[a-zA-Z0-9-]+(\.[a-zA-Z0-9-...原创 2019-01-06 10:55:44 · 844 阅读 · 0 评论