- 博客(2)
- 收藏
- 关注
原创 猫眼电影TOP100爬虫
需求分析根据用户输入的页码数获取猫眼电影TOP100指定页面电影的排名、图片链接、标题、演员表、上映时间、评分。主要逻辑发送请求,获取响应使用正则表达式提取HTML页面的数据将获取的内容写入到maoyan.txt文件中页面分析打开chrome浏览器输入maoyan.com依次点击榜单、TOP100榜进入页面,浏览器地址为https://maoyan.com/board/4我们...
2019-08-26 20:39:59 1994
原创 百度贴吧爬虫
需求分析根据输入的贴吧名字爬取指定贴吧的前100页html。主要逻辑为了养成面向对象编程的思想,我们选择写一个贴吧爬虫类。1.start_url2.发送请求,获取响应3.提取数据,跳到下一页地址 3.1提取列表页的url地址 3.2请求列表页的url地址,获取详情页的第一页 3.3提取详情页第一页的图片,提取下一页的地址 3.4请求详情页下一页的地址,进入循环3.2-3...
2019-08-26 20:36:09 498
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人