- 博客(1)
- 收藏
- 关注
原创 基于Python3的网络爬虫脚本
基于Python3的网络爬虫脚本 此程序仅为学习python所写。 Python3中集成了Urllib库,而Urllib与Urllib2在Python2的复杂程度确实差强人意。在Python3上,我们选择requests库直接get网页,再通过Beautifulsoup4对所得到的数据进行清洗。其难点主要存在于数据清洗时Html语言的分析,以及得到数据进行转字符编码得到中文。 我们所爬取的网页是笔...
2019-12-22 11:45:51 687
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人