FZ2104-CSDN博客

原创爬取豆瓣图书排行

爬取豆瓣图书排行爬虫新手，边学边用，尝试将豆瓣图书排行爬取下来，使用requests库来获取网页，用xpath选择器筛选需要的信息。（一）分析豆瓣图书排行URL先来分析URL，看到这里有我们选的豆瓣图书标签：小说。还有两个参数分别是start和type。简单分析可以得知，start是当前页面第一本书的排行，type是页面的排序方式。其中type参数，T代表页面为综合排序，R代表页面按初版日期排序，S代表页面按评价排序。（二）分析页面中需要的数据打开chrome的开发者栏目，找到我们需要的信息，发

2020-08-18 14:18:14 397

原创 python网络爬虫：实现百度热搜榜前50数据爬取，生成CSV文件

使用python爬虫：实现百度热搜榜前50数据爬取，生成CSV文件（一）代码（二）结果爬虫新手，边学边用，尝试着爬取百度热搜榜前50的数据，将数据以CSV文件格式保存下来，并以爬取时间作为文件名保存。（一）代码from bs4 import BeautifulSoupfrom selenium import webdriverfrom selenium.webdriver.support.wait import WebDriverWaitimport csvimport datetimeu

2020-05-10 21:48:13 2333

空空如也

scrapy运行报错：AttributeError: 'TelnetConsole' object has no attribute 'port'

2020-08-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 爬取豆瓣图书排行

原创 python网络爬虫：实现百度热搜榜前50数据爬取，生成CSV文件

空空如也

scrapy运行报错：AttributeError: 'TelnetConsole' object has no attribute 'port'

原创爬取豆瓣图书排行