- 博客(1)
- 收藏
- 关注
原创 Python爬虫获取新闻
获取新闻,bs4模块库解析第一步是先实例化一个BeautifulSoup对象,并且将HTML源码加载到这个对象中。第二步是调用该对象的方法或属性定位到页面的标签,对标签中的数据进行提取。开始前需要安装bs4第三方库,以提供对HTML源码的解析功能,一般情况下使用lxml解析器进行解析。用Python爬虫获取湘潭大学官网的新闻内容,通过拓展,也可以爬取其他网页上的文字内容,博主使用的软件为VS CODE。注意要在代码文件同一目录下先创建一个txt文件,这里命名为newlist.txt。
2023-07-02 22:43:21 993
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人