爬虫学习入门打卡2——基础知识的了解
虽然自己对电脑并不陌生,但是对于一些网络知识并不是特别的了解,比如http、https原理等,自己只是知道存在这个,却不知道他的含义。本着学习使人进步的态度,从零开始学习。
在了解http基本原理之前,我们先来了解一下URL(Uniform Resource Identifier)统一资源定位符、URI(Universal Resource Locator )统一资源标志符,URL是URI的子集,也就是说URI包含URL,补:(URI还有一个子集是URN),URL和URI我们称之为网页链接,就是比如说,你现在需要在网络上找一个资源,我们就用URL和URI来唯一指定访问这个资源的访问方式,而这其中就包含着访问协议、路径等等,通过它(URL、URI)就能在互联网上找到这个资源。
http全称为Hyper Text Transfer Protocol 中文名:超文本传输协议。http协议是用于从网络传输超文本数据到本地浏览器的传送协议,它能保证高效而又准确地传输超文本文档。https是http的加强版、https传输内容是经过SSL加密的。简单的来说就是http的安全版,是以安全为目标的http通道。
URL的开头一般会有 http 或 https ,这就是访问资源需要的协议类型