...
1.概述
从用户模型维度的划分可以看出,
属性和兴趣维度的用户模型都可以归入用户画
像(User
Profile)的范畴。所谓用户画像,简单来说就是对用户的信息进行标签
化。如图
1
所示。一方面,标签化是对用户信息进行结构化,方便计算机的识别
和处理;另一方面,标签本身也具有准确性和非二义性,也有利于人工的整理、
分析和统计。
用户信息标签化
用户属性
指相对静态和稳定的人口属性,例如:性别、年龄区间、地域、受教育
程度、学校、公司……这些信息的收集和建立主要依靠产品本身的引导、调查、
第三方提供等。
微博本身就有比较完整的用户注册引导、
用户信息完善任务、
认
证用户审核、
以及大量的合作对象等,
在收集和清洗用户属性的过程中,
需要注
意的主要是标签的规范化以及不同来源信息的交叉验证。
用户兴趣
则是更加动态和易变化的特征,首先兴趣受到人群、环境、热点事件、
行业……等方面的影响,
一旦这些因素发生变化,
用户的兴趣容易产生迁移;
其
次,用户的行为(特指在互联网上的行为)多样且碎片化,不同行为反映出来的
兴趣差异较大。接下来主要介绍一下微博画像中兴趣维度的构建方法。