用户画像简介

1-1 简介

基本概念
1.基本属性:每个人都有一些基本属性(性别、年龄、婚否、收人、教育程度)。
行为记录:购买行为、浏览行为、点击行为、购物车行为,从这些行为中判断出用户的一些信息,比如说经常购买小孩的物品,从此可以判断出小孩的年龄、小孩的性别、等等的一些信息。
2.购买能力:可以判断出用户的购买能力,从而打上购买力的等级标志。
3.行为特征:可以判断用户的行为特征,比如说用户的活跃程度、购物类型。
4.社交网络:可以判断出他的社交网络。
5.心理特征:比如说出促销的敏感度,购物的真诚度。
6.兴趣爱好:颜色的偏好,品牌的偏好。

用户画像的用途
1.精准营销:邮件、短信、
2.用户统计:地域、时段
3.数据挖掘:特征、行为

学习目标:
1.了解hive数据仓库的特点
2.学会使用hive进行数据开发
3.深入理解用户数据的特点
4.掌握如何构建用户画像
5.亲密接触实际项目的开发
6.积累项目实战经验

主要内容:
1.用户画像项目介绍
2.用户画像建模
3.使用hive进项数据开发
4.用户画像数据开发

1-2 用户画像简介

定义
用户画像(UserProfile)也叫用户信息标签化,客户标签。根据基本信息和行为,用一些标签把用户描绘出来,
描述用户的标签就是用户画像。

构建用户画像的技术
1.数据收集:网络日志数据、用户行为数据、网站交易数据
2.行为建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法
3.用户画像:基本属性、购买能力、行为特征、兴趣爱好、心里特征、社交网络

源数据
1.静态信息数据:来源于用户填写的个人资料,或者由此算出的数据。如果有不确定的。可以建立模型来判断。比如用户性别如果不填,可以建立性别模型,通过用户的行为来判断其性别是什么及其概率。
人口属性:性别、生日、年龄、婚否、收人、城市、教育程度、职业、是否有小孩(数量)、星座、月收入
商业属性:消费等级、消费周期
2.动态信息数据:用户行为产生的数据:注册、浏览、点击、购买、签收、评价。
比较重要的行为:购买商品、浏览商品、放入购物车、关注商品。
注册时间、首单时间、潮妈族,纠结商品、最大消费、退货数量、败家指数、品牌偏好。
用户接触点(TouchPoint)
行为类型:浏览、搜索、发表、点赞数
接触点(Tag):女装单品页面、女鞋单品页面……

标签分类
1.确定的标签
2.根据算法猜测的标签

标签举例:
1.用户活跃度:未购买、活跃、沉睡、流失
2.用户分群:电脑达人、数码潮人、家庭用户、有房一族、网购达人、单身贵族、时尚男女、奶爸奶妈、
闪购用户、超级用户。(根据用户购买的品类情况,比如说一级品类、二级品类)

1-3 用户画像用途

用户画像的作用:
1.分类统计:12星座对雾霾天气的防范指数;奶爸当家指数;
访客画像(男女比例;新老用户比;年龄分布;学历分布)
2.营销推荐:邮件营销;短信营销;push信息。
例 判断你有小孩的话,推荐一些母婴产品
3.数据挖掘:根据用户的数据挖掘出一些有用的信息以支持决策。
利用关联规则计算:喜欢红酒的人通常喜欢什么品牌?利用聚类算法分析:喜欢红酒的人,年龄段分布情况。

数据挖掘
1.属性筛选:属性筛选、基于信息增益的属性打分、属性重要性打分、主成分分析、基于卡方检验的属性筛选;
2.分类预测:决策树、神经网络分类、贝叶斯网络、分类回归树、支持向量机分类、逻辑回归、朴素贝叶斯、分类组合模型;
3.回归预测:多元线性回归、神经网络回归、广义线性回归、支持向量机回归、回归组合模型;
4.聚类分析:K均值聚类、基于K均值的层次聚类、分布估计聚类、两阶段聚类;
5.关联分析:购物篮分析、属性关联分析、序列模式分析;
6.时间序列:ARX时间序列

数据挖掘
喜欢什么东西的人往往喜欢什么?
做了这个事的人接下来一般会做什么?
最经典例子:啤酒与尿布的关系。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值