自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

转载 网站数据是如何记录的

想要进行网站数据的分析,就先要知道网站数据是怎么来的。   用户在访问互联网的时候,会向服务器发送服务的请求。发送的请求,就被服务器以一条单独记录的方式记录在服务器的日志中,这就是最原始的网站数据日志。   先看apache的日志。   10.1.1.95 - user [18/Mar/2005:12:21:42 +0800] “GET /stats/aws

2013-11-28 22:22:02 1162

原创 数据挖掘之关联规则

一、基本概念 频繁项:在多个集合中,频繁出现的元素/项,就是频繁项频繁项集:有一系列集合,这些集合有些相同的元素,集合中同时出现频率高的元素形成一个子集,满足一定阈值条件,就是频繁项集。极大频繁项集:元素个数最多的频繁项集合,即其任何超集都是非频繁项集。k项集:k项元素组成的一个集合支持度: 包含频繁项集F的集合的数目可信度:频繁项F与某项j的并集 (即F U {j})的支持度 与 

2013-11-22 16:42:31 1033

原创 ubuntu server 12 上搭建 hadoop2.2 单机伪分布式

创建hadoop用户组:sudo addgroup hadoop  创建hadoop用户:sudo adduser -ingroup hadoop hadoop 给hadoop用户添加权限,打开/etc/sudoers文件: sudo gedit /etc/sudoers在root   ALL=(ALL:ALL)   ALL下添加hadoop   ALL=(ALL:ALL)  ALL, 在U

2013-11-22 09:53:42 1602

10万条天猫交易数据

提供的原始文件有大约4M左右 涉及1千多天猫用户 几千个天猫品牌 总共10万多条的行为记录 用户4种行为类型 Type 对应代码分别为: 点击:0;购买:1;收藏:2;购物车:3

2014-03-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除