爬虫:使用requests_html和bs4进行数据采集和分析博客园
首先我需要准备Python解释器、pycharm开发工具,然后下载相应的库和包、模块,然后进行数据采集爬取。爬虫,即网络爬虫,也叫做网络机器人,可以代替人们自动地在互联网中进行数据信息的采集与整理,大家可以理解为在网络上爬行的一只蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛,如果它遇到自己的猎物(所需要的资源),那么它就会将其抓取下来。
原创
2022-10-11 23:16:32 ·
520 阅读 ·
1 评论