消费行为变量:
1。将变量控制在100个以内,并且在不丢失关键信息的情况下,越少越好
2。以类目归并到生活需要的支出,反映某种生活需要对于网站的依赖度,同时逃避关联需求的计算(是的,不用算就知道买了夏装的人更倾向于买秋装——我们要相信古老的分类体系的科学性——比如,人和猴子的相似性是达尔文告诉我们的(骨骼特征相似),而不是既能变成人又能变成猴子的赛亚人)
3。价格的奇异性,反映对于网站的信任程度
4。好评的奇异性,反映自信度与冲动度
5。收藏的频度分布,反映兴趣点(生活的支出是金钱,兴趣的支出是时间),同时逃避需求周期性的计算
参考 http://www.tbdata.org/archives/194
耐用品的难题
http://www.tbdata.org/archives/189