三行代码,
我可以得到一个世界!
——ESword
前言
某搬运工可惜在2022.1.30就停止更新了😣
在他存亡之际赶紧批量操作了一番🥰
完整代码与结果打包在文末😄
准备工作
支持库安装见专栏:
Python零基础爬虫速成②:批量爬取微信公众号图片
三行代码
使用了lambda匿名函数简写了函数方法
👇可读性下降👇 & 👆Zhuangbility性提升👆
①初始化BeautifulSoup对象
直接获取一个解析好的BS对象
get_soup = lambda web_url:BeautifulSoup(requests.get(web_url).text, 'html.parser')
②文章列表页
find_all函数寻找所有符合的标签
get_article_list = lambda web_url,soup: {result.text:result['href'] for result in soup.find('tbody').find_all('a')}
结果:
标题+url的字典
③文章内容页
获取文章部分的html源码
(可直接写入 .html 文件)
get_web_content = lambda web_url,soup:str(soup.find('section',id="output_wrapper_id"))
完整代码开源
高可读性的批量:
爬文章 + 写html文件 + 制作epub
直接白嫖结果
800+的整合epub版
😀😀😀