分析一个音频的属性,除了固有属性时长、分贝、音色以外,还有诸如作者性别、作者身份、发布时间、发布地理位置、音频内容类别、音频内容、音频热度等。
这里我们考虑推荐短音频的实现,环境属性也放置到后面加强版再处理,只考虑音频的内容类别(已有设置)、音频内容(提取文字信息可以实现,另外一种方式是通过人为的标签来标识,目前我对文字处理还没有了解到很好的办法,后面会持续学习)、音频热度。
这里还要考虑一个因素就是我们boss要求的官推和商推。
同时除了机器学习的推荐作品挑选,还提供人工审核的选举,即后台工作人员人工审核后,将优秀的作品通过某种方式在其还未达到被广泛认知的情况下直接添加到推荐列表。
因为我们的产品是从零开始的,所以还要考虑在用户量、音频数量不足的情况下怎么推荐优质的作品,同时还要考虑当后期用户量、音频数量增长上去的时候怎么筛选(这点想学习抖音的流量池的概念)。
嗯嗯,任重而道远,我们从最简单的一步一步来构建我们的推荐帝国!
首先是音频热度属性整合:
heat= likeNum×10+commentNum×5+playTimes×1+forwordTimes×15;
然后形成属性向量:
i=(a,b,c,d,e,f,g,h);
同时用户画像:
u=(x,y,z,s,k,t,w,p);