- 博客(1)
- 收藏
- 关注
原创 python 爬虫笔记
第一节:urllib模块的使用 urllib是python内置的HTTP请求库,无需安装即可使用,它包含了4个模块: request:它是最基本的http请求模块,用来模拟浏览器发送请求 parse:一个工具模块,提供了许多URL处理方法,如:把URL字符串与URL组件的拆分和合并,或者字典(和js对象差不多)与URL字符串的相互转换 error:异常处理模块,如果请求发生错误可以捕捉致谢异常 robotparser:主要用来识别网站的robots.txt文件,然后判断哪些网站可以爬 1
2020-05-26 12:03:33 216
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人