![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
jianminzhang
这个作者很懒,什么都没留下…
展开
-
爬虫之网页模拟http(get)请求
import urllib.request ''' 中文搜索需要使用urllib.request.quote编码 keyword = '中文' keyword = urllib.request.quote(keyword) ''' keyword = 'python' url = 'http://www.baidu.com/s?wd=' + keyword + '&ie=utf-8&...原创 2019-11-06 17:02:16 · 359 阅读 · 0 评论 -
爬虫之从网页抓取中文
import urllib.request import re pth = '<div class="name">(.*?)</div>' # 正则表达式 data = urllib.request.urlopen('https://read.douban.com/provider/all').read() data = data.decode('utf-8') ...原创 2019-11-06 16:27:59 · 595 阅读 · 0 评论