python
liunianzml
这个作者很懒,什么都没留下…
展开
-
python爬虫1
所用的python为python3.x,与python2.x在一些库的调用上有些许不同。 首先我们需要知道几个库 urlib ,urlib.request 这是网络请求的库 1.最简单的爬虫 爬取百度 import urllib import urllib.request # 爬虫百度,根据关键词进行爬取 data = {} data['word'] = '火影' url_value原创 2016-07-08 09:04:43 · 483 阅读 · 0 评论 -
正则表达式
正则表达式,在过滤字符串和匹配检查字符串上具有简便性。再字符中处理,爬虫信息过滤中有很有用。 下面是一些匹配的对应 .正则表达式相关注解 re.compile(string[,flag]) #以下为匹配所用函数 re.match(pattern, string[, flags]) re.search(pattern, string[,原创 2016-07-08 09:48:12 · 159 阅读 · 0 评论