从 1991 年 Tim Berners-Lee 发明了万维网(World Wide Web)开始到 2011 年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了 12、 13 两年热炒之后,人们逐渐冷静下来,更加聚焦于如何利用大数据挖掘潜在的 商业价值,如何在企业中实实在在的应用大数据技术。伴随着大数据应用的讨论、 创新,个性化技术成为了一个重要落地点。相比传统的线下会员管理、问卷调查、 购物篮分析,大数据第一次使得企业能够通过互联网便利地获取用户更为广泛的 反馈信息,为进一步精准、快速地分析用户行为习惯、消费习惯等重要商业信息, 提供了足够的数据基础。伴随着对人的了解逐步深入,一个概念悄然而生:用户 画像(UserProfile),完美地抽象出一个用户的信息全貌,可以看作企业应用大 数据的根基。
一、什么是用户画像?
男,31 岁,已婚,收入 1 万以上,爱美食,团购达人,喜欢红酒配香烟。 这样一串描述即为用户画像的典型案例。如果用一句话来描述,即:用户信 息标签化。
如果用一幅图来展现,即:
二、为什么需要用户画像
用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能 够理解并且方便计算机处理,如,可以做分类统计:喜欢红酒的用户有多少?喜 2 欢红酒的人群中,男、女比例是多少?也可以做数据挖掘工作:利用关联规则计 算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年 龄段分布情况?
大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算 机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当 计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领 域,都将能进一步提升精准度,提高信息获取的效率。
三、如何构建用户画像
一个标签通常是人为规定的高度精炼的特征标识,如年