爬取豆瓣250本书籍

最新推荐文章于 2021-06-06 14:03:04 发布

爱吃葱的小石头

最新推荐文章于 2021-06-06 14:03:04 发布

阅读量197

点赞数

分类专栏：爬虫文章标签： python url

本文链接：https://blog.csdn.net/weixin_47433564/article/details/107883126

版权

使用Python爬虫，结合requests和BeautifulSoup库，爬取并保存了豆瓣Top250书籍到.txt文件中。主要代码实现包括发送请求、解析HTML以及将数据写入文件。每25条书籍信息请求一次，共请求11次，每次请求之间间隔0.2秒以防止频繁请求被封禁。

摘要由CSDN通过智能技术生成

爬虫爬取豆瓣top250书籍并保存进.txt文件

使用的工具：pycharm

使用的包:requests,bs4，time

以下是本次爬取的代码

import requests
from bs4 import BeautifulSoup
import time

#发送请求
def request_dangdang(url,headers):
try:
response = requests.get (url,headers=headers)
if response.status_code==200:
return response.text
except requests.RequestException:
return None

#解析文件
def parse_result(soup):
contents=soup.find(class_=‘article’).find_all(name=‘table’,width=‘100%’)#.get_text().replace(’ ‘, ‘’).replace(’\n’,’ ').strip()

for item in contents:
    item_bookname=item.find(name='div',class_='pl2').find(name='a').get_text().replace('\n','').replace(' ','')
    item_author=item.find(name='p',class_='pl').get_text()
    item_pl=item.find(name='span&#

最低0.47元/天解锁文章

爱吃葱的小石头

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
爬取豆瓣250本书籍

爬虫爬取豆瓣top250书籍并保存进.txt文件欢迎使用Markdown编辑器使用的工具：pycharm使用的包:requests,bs4以下是本次爬取的代码你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：全新的界面设计
复制链接

扫一扫

专栏目录