网站跟踪并不是什么新的技术,而只是一种比较常见的应用,甚至都谈不上新。这里想跟大家分享一下,里面有我的一些想法和思考,如果有不准确的地方,还请不吝赐教。
为什么要跟踪
现在大家对隐私都比较敏感,而且对互联网流氓都比较警惕,所以一旦提到“跟踪”字眼就会觉得很不舒服。那我们先谈谈为什么会有网站跟踪。
- 作为服务提供商,我们当然会希望知道用户对所提供服务的态度,这在任何行业都是明显的,对传统行业而言,销量就是最直接的消费者态度。但是对于互联网而言,并不大直接明显。
- 当对用户的数据进行搜集之后,服务提供商可以对这些数据进行挖掘,进行数据推荐等等来更加吸引用户或者增加收入(比如广告推荐等等)。
如何跟踪
作为服务提供商,如何知道用户的行为呢?
- 传统方法:在服务端代码中使用日志。日志系统有简单有复杂的,基本原理都是当有请求访问时,服务器创建线程并执行代码,然后将一些日志信息存储到文件系统中。其中日志信息基本都来自于HTTP请求报头。
- 在HTML页面中插入一段代码,该代码可以记录一些信息:用户访问页面的title、URL、用户点击链接、用户在页面停留的时间等等等等。
这两种方法各有利弊吧,但是第二种优点更多
- 首先,它直接面向用户,所有的数据都是准确的,而且信息会更全。这比第一种方法获取的数据量会少一些(第一种包含了爬虫的信息)。
- 其次,它可以统计出有多少用户访问您的主页达到多次,这个可以用来衡量有多少忠实用户,但是对于第一种方法,就