访问网页的过程
在浏览器中输入网页地址(URL),浏览器就会向服务器发送请求,这个请求包含了请求头(服务器要使用的附加信息),请求体等内容。服务器收到请求后,会响应,返回给浏览器响应体(返回的真正客户端要用的内容(HTML,json)等),响应头等内容。浏览器收到后,在本地渲染,就成了我们看到的网页。
服务器渲染与客户端渲染
服务器渲染:在服务器那边直接把数据和html整合在一起,统一返回给浏览器,在页面源代码中能看到数据。
客户端渲染:第一次请求只要一个html骨架。第二次请求拿到数据,进行数据展示。在页面源代码中,看不到数据。
HTTP协议把一条消息分为三大块内容.无论是请求还是响应都是三块内容
请求:
1,请求行->请求方式(get/post)请求url地址协议。
2,请求头->放一些服务器要使用的附加信息。
3,请求体->一般放一些请求参数。
响应:
1,状态行-→>协议状态码。
2,响应头->放一些客户端要使用的一些附加信息。
3.响应体->服务器返回的真正客户端要用的内容(HTML,json)等
爬虫常用请求方式:
get请求:显示请求
post请求:隐式请求
网页的构成(由html,css,javascript三部分组成)
html:超文本标记语言,定义网页的骨架。
css:编写网页的外观,
javascript:编写网页的交互效果,页面逻辑。