- 博客(2)
- 收藏
- 关注
转载 一看就明白的爬虫入门讲解:基础理论篇
关于爬虫内容的分享,我会分成两篇,六个部分来分享,分别是: 我们的目的是什么内容从何而来了解网络请求一些常见的限制方式尝试解决问题的思路效率问题的取舍 一、我们的目的是什么 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值,内容一般分为两部分,非结构化的文本,或结构化的文本。 1. 关于非结构化的数据 1.1 HTML文本(包
2015-11-17 23:37:37 654
转载 浏览器 HTTP 缓存原理分析
以前项目中遇到了很多浏览器缓存相关的问题,也在网上查过资料,搞过服务器的配置,来确保客户端加载服务器资源的速度和资源有效性。最近仔细看了下http协议中和缓存相关的一些属性,总结一下。 浏览器缓存原理 文字版描述 ①浏览器第一次访问服务器资源 /index.html 在浏览器中没有缓存文件,直接向服务器发送请求。 服务器返回 200 OK,实体中返
2015-11-12 21:47:22 383
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人