Python爬虫
小白学爬虫
草莓味的狮子座leo
这个作者很懒,什么都没留下…
展开
-
爬虫原理
基本流程 发起请求 通过http库发起请求,发送一个request 获取响应的内容 服务器正常响应,获得一个response,Response的内容即需要获取的内容,类型可为:html、json、二进制数据 解析内容 HTML类型:re,页面解析库进行解析 Json:直接转换为Json对象 二进制数据:保存或者进一步处理 保存数据 存为文本; 保存至数据库; 保存特定格式的文件 ...原创 2020-05-24 13:20:37 · 260 阅读 · 0 评论 -
Cookies与Session
静态网页 html页面,后缀为.html,可以直接部署到web容器,在浏览器端通过链接访问。常用的web容器有:Nginx、Apache、Tomcat等 动态网页 动态网页可以解析URL中的参数,或者关联数据库中的数据,显示不同网页内容。由jsp、php等语言编写 Session 会话,产生在服务端,用来保存当前用户的会话信息 Cookies 保存在浏览器(客户端),当用户(浏览器)再次访问服务端的时候,将此cookies带上,这时候,服务端可以通过Cookies识别...原创 2020-05-23 20:35:36 · 245 阅读 · 0 评论