我们一起学爬虫-CSDN博客

原创猫眼电影TOP100爬虫

需求分析根据用户输入的页码数获取猫眼电影TOP100指定页面电影的排名、图片链接、标题、演员表、上映时间、评分。主要逻辑发送请求，获取响应使用正则表达式提取HTML页面的数据将获取的内容写入到maoyan.txt文件中页面分析打开chrome浏览器输入maoyan.com依次点击榜单、TOP100榜进入页面，浏览器地址为https://maoyan.com/board/4我们...

2019-08-26 20:39:59 1994

原创百度贴吧爬虫

需求分析根据输入的贴吧名字爬取指定贴吧的前100页html。主要逻辑为了养成面向对象编程的思想，我们选择写一个贴吧爬虫类。1.start_url2.发送请求，获取响应3.提取数据，跳到下一页地址 3.1提取列表页的url地址 3.2请求列表页的url地址,获取详情页的第一页 3.3提取详情页第一页的图片，提取下一页的地址 3.4请求详情页下一页的地址，进入循环3.2-3...

2019-08-26 20:36:09 498

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 猫眼电影TOP100爬虫

原创 百度贴吧爬虫

空空如也

空空如也

原创猫眼电影TOP100爬虫

原创百度贴吧爬虫