![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 58
流动的白沙
坚持一定很酷(自学前端的一枚小白,学习中...... 期待与你一起进步
展开
-
爬虫实战|从笔趣阁爬取书籍并简单保存
最近在看崔庆才那本经典的爬虫开发书籍,之前虽然看过一点视频,但是与书籍相比还是书籍更加成体系,让我对知识有一个宏观的把控。目前已经看了前四章,了解了一些基础知识和如何解析数据的方法,但是对于数据的保存还不是很清楚。话不多说,今天主要是从笔趣阁上爬取书籍并简单保存。(菜鸟小白,不对的地方欢迎指正)1. 首先我们需要导入一些库:import requestsfrom requests.exceptions import RequestExceptionfrom lxml import etre原创 2021-07-29 22:20:28 · 1463 阅读 · 0 评论 -
豆瓣读书top250
import requestsfrom lxml import etreeimport refrom pyecharts import Barbooks = []def parse_page(url): headers = { 'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) and \ AppleWebKit/537.36 (KHTML, like Gecko..原创 2021-07-19 14:26:04 · 279 阅读 · 0 评论 -
爬虫之xpath/BeautifulSoup/re 基础学习总结(一)
背景:小白,没有计算机基础,只学过python基础语法。大二,目前因为感兴趣所以先学着。开始学习爬虫,记录学习情况,这是我的第一篇文章,存在诸多不足,如果偶尔看见这篇文章,欢迎各位批评指正,也可以对我的学习给予一些建议。现在就是看成套的视频教程学习,过一段时间准备买崔庆才老师的《python 3: 网络爬虫开发实战》学习正文:1. 首先是导入模块,三种都需要导入requests库:import requests,此外使用BeautifulSoup语法:from bs4 import Beaut.原创 2021-07-15 17:42:38 · 404 阅读 · 0 评论