用户画像算法分享和干货推荐

在做用户画像时,首先要认识用户画像,用户画像是根据网络中海量的用户信息抽象出的一个标签化的用户模型。 从互联网各大平台中,通过主动(爬虫)或者被动(公司留下的客户历史足迹)地收集用户信息,再经过分析和加工,就能形成一系列的用户个性化标签。就是下图这个样子的:

关于用户画像的构建csdn上有很多,但大多是在结构上和业务上做了介绍,有一些有价值的博客做了用户画像模型构建方法的深度讲解。不同的是,各种竞赛kaggle、达观题目里做了业务分析和需要的标签,需要竞赛者实现算法。

所以本文找来干货博客和竞赛者博客结合构成总的用户画像的构建。

希望大家能看完再判断自己需要哪些东西来填充自己用户画像使其越来越丰满。

用户画像的构建分为几个部分:

一、获取数据

除了爬虫是自己主动获取的,竞争者的题目和公司业务都是已经存在的数据。我做的电影用户画像是从豆瓣爬取的,其他含有用户信息的平台也可以,比如豆瓣的特点就是用户之间有交互,可以写个人日记等等,猫眼的特点就是用户有购票记录,当然购票平台不止一个,用户也有可能去别的平台购票。注意分析平台的数据特征,想象一下自己需要构建用户什么样的标签,从而知道自己需要获取什么样的信息,还有&#x

  • 5
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值