书籍信息
《内容算法:把内容变成有价值的效率系统》,作者闫泽华,曾任今日头条资深产品经理,现任知乎知识市场产品总监。该书首次出版于2018年4月。
推荐系统的业务模型
内容推荐系统本质上要“解决用户、环境和内容的匹配”:y = F(xi, xu, xc)。
注解:即解决内容特征的提取、用户特征的提取、环境特征的提取,将这三方的数据作为原料输入系统,最终输出一个值,用以表达对该内容的推荐倾向。
断物——内容特征的提取
使用“分类”和“标签”更好地结构化推荐对象的信息。
分类
分类是树状的,是自上而下依次划分的。在分类体系里,每个节点都有严格的父类继承关系,在兄弟节点层都具有可以被完全枚举的属性值。
注解:分类由专家系统进行枚举产生,要求是覆盖面要广要全,让所有进入系统的内容都有分类,并且归属到越低的分类,推荐的置信度越高。
标签
标签是网状的,更强调表达属性关系(Has a)而非继承关系(Is a),只有权重大小之分,不强调包含与被包含关系。
标签从何而来?典型的产出方式有专家系统产出(PGC)和普通网友产出