先抄别人一段话,省的我解释了:
在网站的统计数据中有对网站流量来路的统计,这些数据到底是怎么来的呢?这就要从浏览器如何访问一个网址说起了,简单点来说,当我们通过输入网址或者其他途径(点击网页中链接、地址收藏栏等)访问某个网址的时候,浏览器会向网页所在的web服务器发送http请求,web服务器在接受到请求后做相应的处理,并返回处理结果给客户端浏览器,如果一切正常的话,客户端(浏览器)就可以看到最终的网页效果了。
在客户端(浏览器)向web服务器发送请求(HTTP Request)的过程中会发送一些信息,这些信息叫做HTTP Header,web服务器会对HTTP Request做出回应,回应的消息叫做Response Header。流量统计中的网站来路和HTTP Header有关,在HTTP Header中可以包含HTTP Referer,在向服务器请求网页数据的时候服务器通过Referer就知道当前是从哪个网页过来的了,用PHP和ASP我们也可以很容易的获取到Referer信息。
但是要注意:来路统计并不一定准确,完全可以通过程序进行来路的伪造。
那么如何伪装来路呢?其实就是设置referrer的事情。
再抄一段,反正我就是懒:
HTTP Referer是header的一部分,当浏览器向web服务器发送请求的时候,一般会带上Referer,告诉服务器我是从哪个页面链接过来的,服务器籍此可以获得一些信息用于处理。比如从我主页上链接到一个朋友那里,他的服务器就能够从HTTP Referer中统计出每天有多少用户点击我主页上的链接访问他的网站。
Referer的正确英语拼法是referrer。由于早期HTTP规范的拼写错误,为了保持向后兼容就将错就错了。其它网络技术的规范企图修正此问题,使用正确拼法,所以目前拼法不统一。
既然是做java的,那么来看下如何在协议中获取和指定来路。
编写一个工程,新建一个JSP,内容:
String path = request.getContextPath();
String basePath = request.getScheme()+"://"+request.getServerName()+":"+request.getServerPort()+path+"/";
%>
HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
">
检查来路来路:
直接用浏览器访问,输出:来路:null
然后使用火狐浏览器的一个插件restclient来指定来路,这里设置就是来自本站www.javacui.com:
查看服务器响应:
可以看到,实际来路就是本站了。