关于页面来源统计的一点点思考

在网站的各种监控中,页面的点击来源是一个重要的数据。

常见的方式有两个:referrer,url加参数。

referrer方式

这种方式受浏览器限制,不同浏览器在用户作出不同行为时,处理方式是不一样的。比如在以下情况下,浏览器可能不发referrer。

1,修改Location对象进行页面导航
2,windowopen 方式打开新窗口
3,鼠标拖拽打开新窗口
4,点击Flash内部链接
5,HTTPS跳转到HTTP
6,收藏夹直接打开 / 地址栏手动输入

受制于用户的浏览器和浏览习惯。这会导致丢失很多数据。

url加参数

服务器端维护一个参数与来源的映射表。在页面展示链接的时候将本页的对应参数加到url后面。这样点击该url的时候就知道是从什么页面过来的了。例如:

我有映射表:index=首页,listing=列表页
用来标记来源的参数名:from
我在列表页的链接后面都加上:from=listing。比如:http://example.com/info/20834735/?from=listing
这样我在点击 http://example.com/info/20834735/?from=listing 的时候就知道页面是从列表页点过来的了。

这种方式可以比referrer方式少丢些数据,但是对于站外的链接(比如:搜索引擎)就无能为力了,因为搜索引擎会把你加了参数的链接(http://example.com/info/20834735/?from=listing)一起抓了。这就统计了错误的数据。而且还会影响SEO。不过,如果是大型商业搜索引擎还可以通过__rel="canonical"__标签来解决,其他爬虫就无能为力了。

共同的问题

当用户在地址栏直接输入地址,无论是点收藏夹还是复制粘贴,或者手动输入,都无法正确统计页面的来源(referrer为空,url参数不能正确反映点击来源)。

办法

暂时没啥好办法来提高统计的准确率。两种方式结合使用可以有所改善,但治标不治本。有好办法的朋友一定不要吝啬哦。

转载于:https://my.oschina.net/liuxd/blog/100802

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值