urllib基本库的使用:request,error,parse,robotparser:
urllib.request模块提供最基本的构造Http请求的方法,利用它可以模拟浏览器的一个请求发起过程,同时它还带有处理授权验证、重定向、浏览器Cookies以及其他内容。 data参数是可选的。
timeout参数 用于设置超时时间,单位为秒;
其它参数,context参数,必须是ssl.SSLContext类型,用来指定SSL设置;
Request:利用urlopen()方法可以实现最基本请求的发起,
处理异常:UrlError:来自urllib库的error模块,继承自OSError类,是error异常模块的基类;HttpError处理HTTP请求错误;code返回HTTP状态码,reason,同父类一样,用于返回错误的原因;headers,返回请求头。
使用Requests,
抓取二进制数据: