- 博客(2)
- 收藏
- 关注
原创 Python Beautiful Soup 实现跨页面的数据抓取(以新闻列表页为例)
前言近期业务需求,需对某网站的新闻列表页的标题、链接以及跳转子链对新闻内容进行提取与下载。因此,采用Python 的Beautiful Soup完成业务需求,本文为学习beautifulsoup包的学习笔记。在此之前声明本文以下用词的定义:主链:新闻列表页的链接子链:新闻列表页中每条新闻的链接,即新闻详情页的链接requests模块:一个支持HTTP服务的模块,主要用于HTTP请求re模块:正则表达式,不过多解释,等过两天单独整理一版python正则表达式的博文BeautifulSoup安
2022-05-26 16:34:40 684 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人