URL
URI - Universal Resource Identifier - 统一资源标识符
URL - Universal Resource Locator - 统一资源定位符
URI = URL + URN(x)
https://www.baidu.com:443/index.html
https://14.215.177.38:80/index.html
-
协议 - HTTP / HTTPS
HTTP - Hyper-Text Transfer Prrotocol
HTML - Hyper-Text Markup LanguageHTTPS - HTTP over SSL 安全的HTTP
2017年1月1日苹果App Store 强制使用HTTPS 微信小程序强制使用HTTPS跟后台程序通信 Chrome 从2017年发布的版本开始都会对HTTP提示不安全
-
域名/IP地址 - 要连接的主机
-
端口号 - 端口用来区分不同的服务
-
资源路径
DNS - Domain Nme System - 将域名解析为IP地址
HTTP
HTTP协议 - 请求响应式的协议
HTTP请求
-
请求行 - GET / HTTP/1.1
- GET:从服务器获取资源 - POST:向服务器提交数据
-
请求头 - 键值对 - 告诉服务器的额外的信息
-
空行(\r\n)
-
消息体 - 你要发给服务器的数据
HTTP响应
-
响应行 - HTTP/1.1 200 OK
- 响应状态码 - 404 Not Found / 403 Forbidden ~ 2xx:成功了 ~ 3xx:重定向 ~ 4xx:请求有问题 ~ 5xx:服务器有问题
-
响应头 - 键值对 - 服务器给浏览器的额外信息
-
空行(\r\n)
-
消息体 - 服务器发给浏览器的数据
- 如果请求的是图片,就获得图片的二进制数据 - 如果请求的网页,就获得网页的源代码,浏览器执行代码,用户看到页面
HTML页面源代码
HTML - 超文本标记语言 - 网页的内容都是写在标签里面
<!doctype html>
<html>
<head>
写在这里的内容不会显示在浏览器窗口
但是这里却包含了网页比较重要的元信息
</head>
<body>
写在这里的内容会显示在浏览器窗口中
</body>
</html>
-
HTML页面源代码由三样东西构成:
1. 标签 - 数据(content - 承载内容) 2. 层叠样式表(CSS)- 显示(display - 渲染页面) 3. JavaScript(JS)- 行为(behavior - 交互行为)
-
文本
h1~h6:标题 p:段落 sub / sup:下标、上标 em / strong: 强调
-
图像
img - src属性
-
链接
a - href属性 / name属性 / target属性(_self/_blank/_parent/_top) ~ 页面链接 ~ 锚链接 ~ 功能链接
-
列表
ul - 无序列表(unordered list) - li(列表项,list item) ol - 有序列表(ordered list) dl - 定义列表(definition list)- dt(定义标题)/ dd(定义描述)
-
音视频
audio video
Python程序联网获取数据
requests
pip config set global.index-url https://pypi.doubanio.com/simple
pip install requests
pip list / pip freeze