推荐系统文章

- Item2Vec

被同一个用户点击过的Item们,作为正例;随机采样负例;做Word2Vec

User作为1个Vec; 每个文章作为1个Vec;User的Vec和他点过的文章的Vec拉近距离;User的Vec和他Skip过的(随机行么?)文章的Vec拉远距离;最后得到靠谱的UserVec和DocVec


-  关于用户画像产品构建和应用的几点经验

用户全景视图是很难统一的,建议区别构建,会有意想不到的好处;例如贝聊就有家长、宝宝、老师、幼儿园等用户对象,不同对象的行为和标签等数据差异很大,全景视图展示也无法统一;切开做后,再关联,复杂度快速下降,实效很多。

基本属性主要囊括用户个人信息方面的出来的标签(如:地理、性别);群体属性主要囊括用户在群体细分方面出来的标签(例如大 V、话题制造者);行为属性主要囊括用户在行为表现和偏好方面的标签(例如爱点赞、爱发图);综合属性主要囊括用户在多方综合后得出的标签(例如生命周期、用户价值)。以贝聊的实践经验,群体细分时候,千万不要僵化思考,作茧自缚,不同的细分方向就会有不同的群体类型标签出来,所以会有很多群体类型标签!

1)基于规则型的人物特征标签识别技术

这类方法识别的标签应该是最多的!主要应用于较为直观或有清晰业务规则的人物标签,例如地域所属、家庭类型、年龄层等等。技术特点是直接有效灵活、计算复杂度低和可解释度高,单个标签涉及到的规则条件一般不超过 3条,使用到的技术知识主要是数理统计类知识,例如基础统计、数值分层、概率分布、均值分析、方差分析等等。

2)基于模型类的人物特征标签识别技术

主要应用于通过简单的规则条件之间组合无法有效识别的人物标签,但是识别出来的标签价值非常大,一般作为基础应用类型标签,标签的生命周期很长,例如行为偏好、性别预测、群体细分等等。

基于模型类的标签技术特点是综合程度高、复杂程度高;绝大部分标签需要先有针对性地构建相应的挖掘指标体系,依托经典数学算法或模型进行多指标间的综合计算方能得到特征标签,常常需要多种算法一起组合来建模。其中涉及到的经典算法技术主要有熵值法、层次分析法(处理模型权重问题),聚类分析等(处理分类和归集问题),回归分析、时间序列等(处理预测等问题),等等。

3)基于算法型的人物特征标签识别技术

主要应用于特定类场景或特定类数据的人物标签识别。例如应用卷积神经网络和机器学习算法技术对孩子在幼儿园的活动参与图片进行识别,判断图片中幼儿周围的同伴数量,以此推断幼儿的社交活跃情况和性格(例如:活跃型、孤僻型等等)。

基于专类算法的标签技术特点是专业性强、针对性强、聚焦度高,部分场景下能批量输出一系列的人物标签。其中涉及到的专业技术主要有图像识别技术、音视频分析技术、文本分析技术等等,算法层主要有神经网络、机器学习、社群发现算法、语义分析算法等等。


1)推荐算法引擎

主要容载各个推荐算法,每个推荐算法输出自己的推荐结果以及得分;每个算法聚焦自己推荐问题领域的结果准确性,有些是解决新用户推荐问题的,有些是解决特殊场景推荐问题的,有些是解决业务依赖推荐问题的,不一一详述,以作者的经验,一般推荐组合中会有一套算法是重磅的、作为算法组合的母机

推荐算法组合,关键要点是要解决好各算法推荐结果的得分量级一致性,意思是各算法的推荐结果得分要有可对比性,这个不难,不做详述。

2)推荐策略引擎

主要容载各个推荐策略,需要区分不同的用户群体,每个群体适用不同的算法(通过权重分配),群体的划分,可以通过用户标签来指定(可以通过开发一个工具,打通策略引擎和标签引擎,进行快速配置推荐策略)。每条策略一定要有效期,否则无法进行策略的生命周期管理,有些策略生命周期很短的,例如节日期间的推荐策略,一般只适用这个节日前、中两个阶段,过了就要过期了。

3)算法权重自分配机制

对具体用户来说,每条策略的各算法组合的权重是不同的,可以在配置策略的时候根据经验主观敲定,这种方法不利的地方,是无法及时有效的跟随用户的行为和需求变化(人是善变的!),作者偏好采用权重自分配调节机制。

作者的实践经验是,可以根据推荐的效果进行权重的自调节,例如新闻推荐:如果用户对算法组合中的一个算法的推荐结果不感冒(点击率低),则这个算法分配的权重自动降低一点(分配到效果好的算法上面去),经过一段时间后,该用户的推荐策略的算法权重分配就会稳定下来,并且可以自动化动态调整(跟随用户行为变化而变化),不用人为干预!



- ****CTR点击率预估干货分享

http://blog.csdn.net/bitcarmanlee/article/details/52138970

GBDT级连LR(FTRL,FM, FFM)


-**推荐系统必读的10篇精选技术文章

http://cache.baiducontent.com/c?m=9d78d513d9d430d94f9c90697d67c0121d4381132ba6a4020fd38439e5732b405321a3e52878564291d27d141cb21902b7a52172405261e1c7df883d81ecd4356ed27c6c2b40d35615a71bafc840389260d601b8f14efaeca774c0f58c92c25351c158017c81f6&p=8167c54ad6c042b543a8c7710f4783&newp=8667c918ce934eaf5beed02d02149e231610db2151dcd301298ffe0cc4241a1a1a3aecbf21221106d8c47e6605aa4c57e8f63078330434f1f689df08d2ecce7e6b&user=baidu&fm=sc&query=%CD%C6%BC%F6%CF%B5%CD%B3&qid=f9a4ddc20006f911&p1=5


- **百亿级通用推荐系统实践

http://www.infoq.com/cn/presentations/practice-of-universal-recommendation-system?utm_campaign=rightbar_v2&utm_source=infoq&utm_medium=presentations_link&utm_content=link_text

腾讯面向中小企业的云推荐引擎;


- *微信斑马系统:微信朋友圈广告背后的利器

http://www.infoq.com/cn/articles/wechat-banma-dmp?utm_source=infoq&utm_medium=popular_widget&utm_campaign=popular_content_list&utm_content=homepage

人群画像;人群聚类;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值