![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论坛爬虫
码农一号已就位
一个平平无奇的网络系大学生
展开
-
python爬虫练习之用urllib模块来爬取百度贴吧指定内容指定页面的全网页内容,(版本3)
文章目录可参考:分步:定义类,并初始化定义请求的方法定义存文件的方法定义主体的方法运行主函数完整代码效果可参考:https://blog.csdn.net/xdc1812547560/article/details/107989273https://blog.csdn.net/xdc1812547560/article/details/108027258https://blog.csdn.net/xdc1812547560/article/details/108013490分步:导入库impo原创 2020-08-15 21:05:44 · 6737 阅读 · 0 评论 -
python爬虫练习之用urllib模块来爬取百度贴吧指定内容指定页面的全网页内容,(版本2)
文章目录目标:可参考:第一步引入模块读取页面第二步第三步主函数体运行完整代码运行结果目标:用urllib模块实现根据搜索来获取指定贴吧内容网页,然后以’.html’格式直接保存网页,可参考:https://blog.csdn.net/xdc1812547560/article/details/107989273[https://blog.csdn.net/xdc1812547560/article/details/108013490](https://blog.csdn.net/xdc1812原创 2020-08-15 20:09:33 · 6924 阅读 · 0 评论 -
python爬虫练习之用urllib模块来爬取百度贴吧指定内容指定页面的全网页内容,(版本1)
文章目录目标:计划第一步第二步请求头url拼接与请求获取所需进行编码以便链接参数搜索拼接url并请求第三步文件名存入完整代码效果目标:用urllib模块实现根据搜索来获取指定贴吧内容网页,然后以’.html’格式直接保存网页,计划首先,引入模块,然后分步来完成分三步:1、分析百度网页链接来通过改变链接中的参数来获取指定页面2、获取网页内容3、保存第一步首先分析链接得出页面的变化与参数pn=‘?’有关import urllib.requestimport urllib.parsei原创 2020-08-15 01:55:13 · 7957 阅读 · 1 评论