Python零基础爬虫速成③：三行代码get某乎某选

赛文X

已于 2022-04-03 14:32:47 修改

阅读量3.3k

点赞数 1

分类专栏： python 爬虫文章标签：爬虫 python

于 2022-04-03 10:06:32 首次发布

本文链接：https://blog.csdn.net/Ejzq1/article/details/123932900

版权

17 篇文章 2 订阅

订阅专栏

3 篇文章 1 订阅

订阅专栏

三行代码，
我可以得到一个世界！
——ESword

某搬运工可惜在2022.1.30就停止更新了😣

在他存亡之际赶紧批量操作了一番🥰

完整代码与结果打包在文末😄

支持库安装见专栏：

Python零基础爬虫速成②：批量爬取微信公众号图片

使用了lambda匿名函数简写了函数方法

👇可读性下降👇 & 👆Zhuangbility性提升👆

直接获取一个解析好的BS对象

get_soup = lambda web_url:BeautifulSoup(requests.get(web_url).text, 'html.parser')

find_all函数寻找所有符合的标签

get_article_list = lambda web_url,soup: {result.text:result['href'] for result in soup.find('tbody').find_all('a')}

结果：
标题+url的字典
在这里插入图片描述

获取文章部分的html源码
（可直接写入 .html 文件）
在这里插入图片描述

get_web_content = lambda web_url,soup:str(soup.find('section',id="output_wrapper_id"))

高可读性的批量：
爬文章 + 写html文件 + 制作epub

800+的整合epub版

😀😀😀

关注