数据仓库 design

翻译 2012年03月30日 14:33:44

 

 

消费行为变量:

 

1。将变量控制在100个以内,并且在不丢失关键信息的情况下,越少越好

2。以类目归并到生活需要的支出,反映某种生活需要对于网站的依赖度,同时逃避关联需求的计算(是的,不用算就知道买了夏装的人更倾向于买秋装——我们要相信古老的分类体系的科学性——比如,人和猴子的相似性是达尔文告诉我们的(骨骼特征相似),而不是既能变成人又能变成猴子的赛亚人)

3。价格的奇异性,反映对于网站的信任程度

4。好评的奇异性,反映自信度与冲动度

5。收藏的频度分布,反映兴趣点(生活的支出是金钱,兴趣的支出是时间),同时逃避需求周期性的计算

参考 http://www.tbdata.org/archives/194

 

 

 

耐用品的难题

http://www.tbdata.org/archives/189

 

 

 

 

 

 

数据仓库学习(1)

数据仓库本来从大学的时候我就没有接触过,数据库,数据结构这两门课程有基础,对于数据仓库不是太了解,能够开始接触到数据仓库,最直接的原因就是找工作,我面试京东金融数据仓库的岗位,结果全部的问题全都是关于...
  • wjcquking
  • wjcquking
  • 2015年03月26日 10:51
  • 1612

简要总结 数据仓库VS数据库

本文简要总结以下两个问题,旨在快速理解“数据仓库” 1、什么是“数据仓库”? 2、“数据仓库”与“数据库”的区别? 下面做详细阐述: 1、什么是“数据仓库”? “一个数据仓库通常是一个面...
  • wl101yjx
  • wl101yjx
  • 2014年06月15日 18:51
  • 1841

认识数据仓库建设意义

随着近几年互联网的蓬勃发展,网购用户成级数级增长。仅去年双十一当天销售额就突破了900多亿元。各家网购平台都开始收集交易数据,分析各地区各行业客户购物习惯,同时,利用交易数据和客户行为推出新产品或新功...
  • JAVA_QinWXiao
  • JAVA_QinWXiao
  • 2016年02月28日 13:29
  • 1716

数据仓库工作总结(觉得有点意思)

1.   概述 本文作为我这些年实施数据仓库的总结,如有错误,请各位同仁指正。 文档条理不是很清楚,而且也有很多口水话,我不想搞成一个真正的官方文档,所以很随意,符合我的性格。很多问题我只...
  • jiangshouzhuang
  • jiangshouzhuang
  • 2015年06月21日 16:48
  • 1661

[转]开源数据仓库解决方案GreenPlum

Greenplum DB 号称是世界上第一个开源的大规模并行数据仓库,最初是基于 PostgreSQL,现在已经添加了大量数据库方面的创新。Greenplum 提供 PD 级别数据量的强大和快速分析能...
  • heiyeshuwu
  • heiyeshuwu
  • 2016年05月03日 18:51
  • 5120

数据仓库成功的主要指标

数据仓库项目开始之前,为慎重起见,先花费一点时间评估一下继续行进所需要的机构准备情况。 根据从开发实践中积累起来的经验,确定了五个用于区别能够平稳推进的项目与总是出问题的项目的因素。 这些因素是衡...
  • liguoming05
  • liguoming05
  • 2013年09月09日 09:36
  • 1178

谈谈数据仓库架构的发展和分类

最近在网上看到了  Jerome 20061210 最近大家对数据仓库架构的讨论又多了起来,我在这里对一些架构进行一下简单的整理。目的是给大家树立一个靶子,大家可以在这篇文章后...
  • yangxin114
  • yangxin114
  • 2014年06月20日 10:06
  • 2163

腾讯数据仓库 -- 平台综述

腾讯业务产品线众多,拥有海量的活跃用户,每天线上产生的数据超乎想象,必然会成为数据大户。特别是随着传统业务增长放缓,以及移动互联网时代的精细化运营,对于大数据分析和挖掘的重视程度高于以往任何时候,如何...
  • nxcjh321
  • nxcjh321
  • 2016年10月10日 09:49
  • 377

Hadoop之数据仓库构建-Hive

目录 Hive是什么... 1 hadoop是什么... 1 hadoop、hive两者关系... 2 hive的优缺点... 2 hive的存在意义... 2 hive常用命令...
  • erliang20088
  • erliang20088
  • 2015年10月25日 13:26
  • 1499

数据仓库历史演化阅读心得

什么是数据仓库?直观的理解,数据仓库就是大量数据的集合。从古代起,人类一开始通过打结记事,到后来使用文字记事。但是这些方式的信息量都特别少。直到近代大量计算机的使用,还有互联网的迅速崛起,产生了海量的...
  • shikenian520
  • shikenian520
  • 2016年12月29日 10:55
  • 321
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:数据仓库 design
举报原因:
原因补充:

(最多只允许输入30个字)