数据仓库 design

翻译 2012年03月30日 14:33:44

 

 

消费行为变量:

 

1。将变量控制在100个以内,并且在不丢失关键信息的情况下,越少越好

2。以类目归并到生活需要的支出,反映某种生活需要对于网站的依赖度,同时逃避关联需求的计算(是的,不用算就知道买了夏装的人更倾向于买秋装——我们要相信古老的分类体系的科学性——比如,人和猴子的相似性是达尔文告诉我们的(骨骼特征相似),而不是既能变成人又能变成猴子的赛亚人)

3。价格的奇异性,反映对于网站的信任程度

4。好评的奇异性,反映自信度与冲动度

5。收藏的频度分布,反映兴趣点(生活的支出是金钱,兴趣的支出是时间),同时逃避需求周期性的计算

参考 http://www.tbdata.org/archives/194

 

 

 

耐用品的难题

http://www.tbdata.org/archives/189

 

 

 

 

 

 

相关文章推荐

数据库系统.数据库与数据仓库导论

  • 2017年10月25日 23:31
  • 47.11MB
  • 下载

数据仓库笔记

  • 2017年11月17日 10:23
  • 5.63MB
  • 下载

基于Hadoop生态圈的数据仓库实践 —— ETL(一)

一、使用Sqoop抽取数据 1. Sqoop简介         Sqoop是一个在Hadoop与结构化数据存储(如关系数据库)之间高效传输大批量数据的工具。它在2012年3月被成功孵化,现在已是Ap...
  • wzy0623
  • wzy0623
  • 2016年07月01日 22:54
  • 11454

数据仓库项目应该如何选择ETL工具:ETL or E-LT?

根据以往数据仓库项目的经验,在一个数据仓库项目中,ETL设计和实施的工作量一般要占总项目工作量的40%-60%,而且数据仓库项目一般会存在二次需求的问题,客户在项目的实施过程中或者使用过程中会提出新的...

NCR数据仓库实施步骤与项目管理

  • 2016年03月09日 10:48
  • 2.04MB
  • 下载

数据仓库和olap

  • 2015年02月25日 20:17
  • 101KB
  • 下载

数据仓库中的 SQL 性能优化(Hive篇)

转:http://my.oschina.net/leejun2005/blog/308427 一个Hive查询生成多个map reduce job,一个map reduce job又有map,red...

数据仓库基础构架-Hive随谈

  • 2017年10月08日 17:41
  • 6.13MB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:数据仓库 design
举报原因:
原因补充:

(最多只允许输入30个字)