Python爬虫
Chestimouse
分享cs基础知识,计算机视觉,目标检测,深度学习,Python
展开
-
Python爬虫系列——(二)爬取有道翻译
Python爬虫系列——(二)爬取有道翻译 2.1功能说明 打开有道翻译页面,输入要翻译的内容,页面并没有通过刷新来获取数据,所有是使用的前端的Ajax技术进行的交互,也就是说这里使用的是Ajax技术与有道的后台服务器进行的请求,从而得到返回结果。下面我们打开“Chrome"浏览器的”检查“中的"Network"选项卡中,捕获Ajax请求(在XHR中): 可以看到,当我更改输入内容的时候,会自...原创 2019-12-17 11:58:35 · 834 阅读 · 0 评论 -
Python爬虫系列——(一)发起HTTP请求/解析数据
(一)发起HTTP/HTTPS请求 方法一:urllib urllib是python内置的HTTP请求库,无需安装即可使用,它包含了4个模块: request:它是最基本的http请求模块,用来模拟发送请求 error:异常处理模块,如果出现错误可以捕获这些异常 parse:一个工具模块,提供了许多URL处理方法,如:拆分、解析、合并等 robotparser:主要用来识别网站...原创 2019-12-17 10:41:58 · 2623 阅读 · 0 评论