我们假设一个贴近实际的场景,我们现在需要建立一个为用户提供在线电影和电视节目的内容服务系统。
业务成长迅速,用户量和收录的电影量都在增加,现有的业务结构如图所示:
可以看到,现有的系统不断的收录用户数据,然后通过人工的方式选择和推荐电影实现对用户的推荐和批量营销。
那么现在就有问题了,也许有人会质疑你,原有的方式不好吗?为什么非要机器学习?
事实上,使用机器学习的理由有很多,不使用机器学习的理由同样有很多,作为一个算法工程师,自然需要对到来的质问有所准备:
- 不断增长的用户规模,完全依赖人工处理总会有捉襟见肘的一天的。
- 机器学习和统计学习模型等基于模型的方式能够发现人类难以发现的模式。
- 模型能够避免人类在感情上的偏见。
- 没有理由说人工和模型决策不能并存,我们的目标是通过机器学习来负担那些机器擅长且耗时的任务,同时为内容团队提供帮助他们更好理解用户数据的工具。
1.1 个性化和推荐系统
先解决实行过程的阻碍之后,就该用技术好好服务业务了,首先的明白,我们的业务是针对个人用户的,个性化是永远都绕不过去的弯,推荐系统从根本上来说是个性化的一种,向用户提