推荐系统-用户信息数据的采集(1)

马克思说人是一切关系的总和,人是人的历史的总和,他的过去的一切造就了现在的他,他的每一个行为都会和他的家庭教育,他的人生经历有着密切的关系。

           在中国偌大的土地上,生长者各色各样的人,他们有着不同的工作,不同的收入,在不同的地方,发生者各种各样的故事,虽然人一直在不断变化,但是人在某个阶段会不自觉或不得已的按照一种生活模式生活,人的需求在某一个阶段就有一定的稳定性,我们就利用这种稳定性来预测未来。

  用最近自己历史预测未来。

  例如我们发现一个用户,总是在我们的网站浏览手机,那么下一次,我们就会向他推荐手机。

用类似的人的的历史预测未来。

如果你身边有个人,跟你差不多的家庭背景,差不多的大学,差不多的专业,那你们的人生大多数是很相似的。

扯了这么多无关的,回归正题,这篇文章谈推荐系统的数据从哪儿来。

1.显示数据

就是那5克星评分。还有购买数据,收藏物品,这些保存在数据库中,保存在数据库中。数据规整,易于处理。

2.隐式数据

客户的保存,复制,收藏网页,还有在网页的时间等,这些大多数保存在日志中,就是所谓的web使用挖掘。数据混乱,要识别用户和事务,转换为规范数据。

image

转载于:https://www.cnblogs.com/hansongjiang/p/3348764.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值