python3 [入门基础实战] 爬虫入门之爬取豆瓣阅读中文电子书[热门排序]

最新推荐文章于 2021-07-11 23:15:03 发布

VIP文章徐代龙

最新推荐文章于 2021-07-11 23:15:03 发布

阅读量1.5k

点赞数

分类专栏： python 文章标签： python 电子书豆瓣爬虫阅读

本文链接：https://blog.csdn.net/snake_son/article/details/73730511

版权

稍微总结一下：

今天爬的稍微有点打击士气了，但是还是学到了不少东西，

告诉我们，要学会自己去百度，谷歌答案，自己去思考，不要依赖一些技术交流QQ群，很多都是水群的，真的帮助你的是很少的。

重点在这里：今天学了将爬取的数据存取到txt ,.xlsx文件，也就是txt文件跟excel 表格中，又一次加强了re模块的正则表达式，

先贴结果图：

这里写图片描述

这次爬取的是
贴代码：我是比较习惯先贴上代码，让大家先把项目贴进去再跑起来看一看的

# encoding=utf8
import requests
import re
from bs4 import BeautifulSoup
import csv
import time
import threading
from openpyxl import Workbook

num0 = 1  # 用来计数，计算爬取的书一共有多少本

url0 = 'https://read.douban.com/kind/0?sort=hot&promotion_only=False&min_price=None&max_price=None&works_type=None'  # 原创写作(都是根据热门一栏进行选择)
url1 = 'https://read.douban.com/kind/1?sort=hot&promotion_only=False&min_price=None&max_price=None&works_type=None'  # 中文电子书
url2 = 'https://read.douban.com/kind/300?sort=hot&promotion_only=False&min_price=None&max_price=None&works_type=None'

最低0.47元/天解锁文章

徐代龙

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
python3 [入门基础实战] 爬虫入门之爬取豆瓣阅读中文电子书[热门排序]

稍微总结一下：今天爬的稍微有点打击士气了，但是还是学到了不少东西，告诉我们，要学会自己去百度，谷歌答案，自己去思考，不要依赖一些技术交流QQ群，很多都是水群的，真的帮助你的是很少的。重点在这里：今天学了将爬取的数据存取到txt ,.xlsx文件，也就是txt文件跟excel 表格中，又一次加强了re模块的正则表达式，先贴结果图：这次爬取的是贴代码：我是比较习惯先贴上代
复制链接

扫一扫