呐,今天是爬虫学习第二天,今天学习了请求对象的定制
url(网址)有协议、主机、端口号、路径、参数、锚点组成。常见的http、https就是协议,点后的(如baidu)为主机,其他几部分一般看不见。
UA即user agent,它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本。浏览器内核、浏览器渲染引擎、浏览器语言、浏览器插件等。我们要得到自己的UA可以在edge://version/里查看(:前为浏览器名称如chrome,我用的是Microsoft edge,所以为edge)。
得到了UA后就可以完成请求对象定制了。request=urllib.request.Request(url=,headers=),urllib.request.urlopen(request)前为定制,后为网页打开。
今天....就是....这些....QAQ。