这章我们来讲如何收集用户信息
一. 首先,我们思考下用户在网站上一般有哪些些行为:
- 随意浏览
- 卧槽,这个东西有点意思
- 点开来看看,加上收藏
- 买之前点开的东西
- 消费这个东西(比如电影)
- 评分
- 用户再次购买或者直接厌恶的不鸟它!
这里其实每步都可以收集很多信息。
- 购买前的点有:购买用户浏览某个信息的时间、扩展阅读、看评论、转发、收藏、关键词搜索、购买行为等等。
- 购买后消费的点:比如打游戏,一直玩了多久,然后卸了决心好好学习,过几天又装上了,说明这游戏可以,有点东西。
- 消费后评分:打分不用说了吧
二. 确定用户是谁
意思就是你要知道使用这是谁,连连看连对喽,方法要么是看后台log要么是cookie
三. 参考其他来源的数据
社交媒体是个大宝库,挖就对了,不展开说,东西太JB多了
四. 实现收集器(The collector)
前面一堆P话,现在终于进入正题,如何实现我们MoiveGEEKs网站的收集器。我们大方向是要把这个收集器和网站分离,这样可拓展性好。从逻辑层面说有两个部分组成Collector:
- 服务器端:利用Django web API,用户请求一过来,我啪啪两下收集起来
- 客户端:利用JS,返回一些用户数据
数据存储是用CSV格式,好处是处理起来简单,坏处是请求查询CSV文件慢,所以我们搞个数据库来解决。</