python爬虫
Forget December
这个作者很懒,什么都没留下…
展开
-
简单爬虫入门
# get请求 import urllib.request if __name__ == "__main__": response = urllib.request.urlopen("http://www.baidu.com") print(response.read().decode('utf-8')) # post请求 import urllib.request if __name__ == "__main__": data = bytes(urllib.parse.原创 2020-12-27 15:34:25 · 135 阅读 · 2 评论 -
python爬虫获取豆瓣电影top250的名字
最近面试了一个爬虫实习岗位,不知道能不能过,先学习一下爬虫练练手. import re import urllib.request import urllib.error def get_douban_pages(): index = 1 # 电影排名 # 伪装成浏览器 header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:84.0) Gecko/201001原创 2020-12-27 15:06:21 · 744 阅读 · 3 评论