- 博客(4)
- 收藏
- 关注
转载 day04
今日内容:一 爬取豌豆荚爬取豌豆荚: 1.访问游戏主页 https://www.wandoujia.com/category/6001 2.点击查看更多,观察network内的请求 - 请求url page2: https://www.wandoujia.com/wdjweb/api/category/more? catId=6001&subCatId...
2019-07-04 09:22:00
103
转载 day03以及作业
我的随笔四昨日回顾: 一、爬取豆瓣电影TOP250 1、爬取电影页 2、解析提取电影信息 3、保存数据 二、selenium请求库 驱动浏览器往目标网站发送请求,获取响应数据。 --不需要分析复杂的通信流程 --执行js代码 --获取动态数据 三、selenium使用 driver=webdriver.Chrome()打开驱动浏览器 #...
2019-07-03 23:08:00
192
转载 day01
我的随笔二POST请求自动登录github。请求URL: http://github.com/session请求方式 GET 请求头: Cookies user-agent:'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chro...
2019-07-01 18:25:00
88
转载 day01爬虫学习
我的随笔1、什么是爬虫爬虫就是抓取数据2、什么是互联网由一堆网络设备,把一台台计算机互联到一起称之为互联网3、互联网建立的目的数据的传递和数据的共享4、什么是数据例如:电商平台的商品数据 链接,信息...5、什么是上网普通用户: 打开浏览器→输入网址→往目标主机发送请求→返回响应数据→把数据渲染到浏览器中爬虫程序: 模拟浏览...
2019-07-01 14:45:00
94
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人