- 博客(4)
- 资源 (14)
- 收藏
- 关注
原创 机器学习 特征工程 特征离散化
如果想深入研究特征离散化,请直接阅读博文最后的英文文献,以免浪费您的时间! 一、什么是特征离散化 简单的说,就是把连续特征分段,每一段内的原始连续特征无差别的看成同一个新特征 二、为什么进行离散化 1、离散化的特征更易于理解 2、离散化的特征能够提高模型准确度,提高运行速度。使得规则或模型更加简洁 3、有些归纳方法比较适于处理离散化特征 三、特征离散化方法 1、认识数据 数据可以分
2016-12-31 18:54:03 8689 2
原创 推荐系统 用户画像 标签聚类 个性化搜索
最近在做短视频推荐,和别的部门配合着做,我们部门做用户画像这一部分。回头看看,我们部门以前做的用户画像只能称之为“所谓的用户画像”。如果一个人不懂用户画像还好指挥来指挥去真的让人无言,不知道其他公司的有没有这样的人儿那,哈哈,扯远了,言归正传。这篇文章只是对文献[1]的一个总结与实践,像我这种才学浅显的人只能照猫画虎了。 1、标签&标签问题 用户可以对物品打标签,这些标签存在: (1)标签冗余
2016-12-18 16:51:44 11599 2
原创 推荐系统:标签兴趣计算
最近在做一个短视频推荐项目,需要计算出用户对那些标签真正感兴、对哪些标签不感兴趣、对那些标签可能感兴趣。例如,对用户张三而言,感兴趣的标签列表<民谣、历史、音乐、军事、文学>,不感兴趣的标签<周杰伦、好声音、那英>,不能确定是否感兴趣的标签<搞笑、惊悚>。当然,在计算用户对标签的感兴趣程度时要对标签进行预处理,是标签质量有所提升,不要出现大量拼写错误、语义模糊、标签冗余等情况。这里介绍下文献[1]的
2016-12-17 15:18:30 1371
原创 推荐系统之标签相关
在推荐系统中,社会化标签越来越重要。标签是用户对物品的偏好的展示,是用户对物品的看法。因此,标签既可以反映用户的偏好,也可以反映物品的特性。然而标签存在像语意不明、噪音等诸多问题。本文把问题缩小,谈谈标签的一些应用。 1、标签之用户画像 一个用户的兴趣可以通过一系列标签展现出来,然而,如何通过标签展示用户的兴趣并不简单。 (1)出现最多的K个标签展示用户兴趣。该方法简单,然而,由于标签是用户随
2016-12-10 16:49:06 2369 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人