![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
推荐系统
我很平凡的
机器学习 大数据 推荐系统
展开
-
推荐系统之标签相关
在推荐系统中,社会化标签越来越重要。标签是用户对物品的偏好的展示,是用户对物品的看法。因此,标签既可以反映用户的偏好,也可以反映物品的特性。然而标签存在像语意不明、噪音等诸多问题。本文把问题缩小,谈谈标签的一些应用。 1、标签之用户画像 一个用户的兴趣可以通过一系列标签展现出来,然而,如何通过标签展示用户的兴趣并不简单。 (1)出现最多的K个标签展示用户兴趣。该方法简单,然而,由于标签是用户随原创 2016-12-10 16:49:06 · 2318 阅读 · 1 评论 -
推荐系统:标签兴趣计算
最近在做一个短视频推荐项目,需要计算出用户对那些标签真正感兴、对哪些标签不感兴趣、对那些标签可能感兴趣。例如,对用户张三而言,感兴趣的标签列表<民谣、历史、音乐、军事、文学>,不感兴趣的标签<周杰伦、好声音、那英>,不能确定是否感兴趣的标签<搞笑、惊悚>。当然,在计算用户对标签的感兴趣程度时要对标签进行预处理,是标签质量有所提升,不要出现大量拼写错误、语义模糊、标签冗余等情况。这里介绍下文献[1]的原创 2016-12-17 15:18:30 · 1345 阅读 · 0 评论 -
机器学习 特征工程 特征离散化
如果想深入研究特征离散化,请直接阅读博文最后的英文文献,以免浪费您的时间! 一、什么是特征离散化 简单的说,就是把连续特征分段,每一段内的原始连续特征无差别的看成同一个新特征 二、为什么进行离散化 1、离散化的特征更易于理解 2、离散化的特征能够提高模型准确度,提高运行速度。使得规则或模型更加简洁 3、有些归纳方法比较适于处理离散化特征 三、特征离散化方法 1、认识数据 数据可以分原创 2016-12-31 18:54:03 · 8643 阅读 · 2 评论 -
推荐系统 用户画像 标签聚类 个性化搜索
最近在做短视频推荐,和别的部门配合着做,我们部门做用户画像这一部分。回头看看,我们部门以前做的用户画像只能称之为“所谓的用户画像”。如果一个人不懂用户画像还好指挥来指挥去真的让人无言,不知道其他公司的有没有这样的人儿那,哈哈,扯远了,言归正传。这篇文章只是对文献[1]的一个总结与实践,像我这种才学浅显的人只能照猫画虎了。 1、标签&标签问题 用户可以对物品打标签,这些标签存在: (1)标签冗余原创 2016-12-18 16:51:44 · 11535 阅读 · 2 评论 -
机器学习 特征工程
本文聊一聊机器学习的大致过程,探讨下机器学习中常见的问题。本文借助了广告CTR预估这条主线,大概流程及内容如图所示: 详细参见此博文 1.想特征 想特征主要靠一些经验,这些经验可能来源于以前做过的项目、特征选择、特征构建等一些实践或知识。大概的方向是想出的特征要具有区分性。比如现在要预测用户对篮球点击的概率,性别就可以作为一个特征,因为根据我们的常识:男性打篮球的可能性比女性要大。那么就引出原创 2017-01-07 11:58:34 · 1816 阅读 · 0 评论 -
推荐系统 新用户引导
在推荐系统中,新用户的冷启动是一个比较棘手的问题。如何通过适当的引导策略使新用户产生更多的点击行为,从而能够快速的学习用户的兴趣偏好,是一个具有挑战与实际意义的问题。本文结合短视频推荐场景,罗列一些可能的引导方法。 1、question/answer:该方法通过事先让新用户做出选择进而学习用户的兴趣偏好。例如,用户在第一次登录新浪微博时,系统会让用户选择一些其感兴趣的类目。该方法需要用户参与调查,原创 2017-01-24 15:33:08 · 1802 阅读 · 1 评论