1.什么是推荐算法?
分析大量数据,最后计算出各种关联性从而进行预测,比如Amazon的商品推荐,今日头条的信息流媒体推荐,甚至是你看个视频右侧的相似推荐等等。这些都需要涉及到推荐算法,随着近几年数据的存储、计算、获取成本不断降低,企业或者是平台所拥有的的数据量也在飞速增加,这么大的数据量需要更好的使用才能发挥出他的价值,这种价值也会成为产品能力甚至是竞争壁垒。而大数据的使用过程中,一个重要的方向就是预测,预测里面一个重要的应用就是推荐。推荐算法会伴随着大数据和AI的发展越来越重要。
2.推荐算法的条件
1.根据和你共同喜好的人来给你推荐。
2.根据你喜欢的物品找出和它相似的来给你推荐。
3.根据给出的关键字来给你推荐,这实际上就退化成了搜索算法。
4.上面的组合来给你推荐。
3.推荐算法分类(大致可以分三类)
1.基于内容的推荐算法
就是根据用户平时自己的行为,比如关注的内容、搜索的内容、收藏的内容等等,根据这些内容去数据集合里面查找相似东西,比如你看了变形金刚Ⅰ,基于内容的推荐算法可以发现变形金刚Ⅱ并且推荐给你。根据的是内容的关联性。优势是可以解决冷启动问题(假如变形金刚Ⅱ没被人关注过,系统自动把Ⅰ和Ⅱ关联上,用户依然可以看到Ⅱ的推荐)。缺点是推荐的内容可能会重复,你看了地震的新闻,后期推荐的全是灾难相关的东西,甚至是有很多地震的;另一个弊端就是一些多媒体(比如音乐、电影、图片等)由于很难提取内容特征,则很难进行推荐,一种解决方式则是人工给这些内容打标签(人工标注的成本比较高)。
2.协同过滤算法
原理是先把个体大体分为两个集合,一个是用户,一个是物品。对于关系的话,每