用户画像案例一:汽车精准营销
做汽车精准营销项目已经快一年的时间了,但是说起正真的用户画像,又不知道该如何说起,所以我就开始从数据的处理流程一点点的来引进用户画像的建立。
1、数据的处理流程
我们用到的技术就是用java写mapreduce框架来实现用户上网数据的url的识别,这里识别用的是正则表达式,其次就是模型的建立使用hive就行处理。
首先我们的数据来源有两个方面:一个是客户的数据,还有一个是网络爬虫数据。
- 客户的数据有:用户手机上网日志(识别上网的url)、基础信息(性别、年龄、省份、地市等)、语音话单(综采话单、计费话单)、App汇总表、用户搜索关键字解析表、综采短信话单等;
- 爬虫数据:在url中我们解析出来一般是汽车的车型id,但在实际的使用中我们用到的却是汽车的名称,所以这就需要爬取汽车网站的数据来进行匹配处理。电话营销会显的更直观,更可靠,所以我们定义了不同的口径去分析用户的购车意向。
数据的处理流程说明如下:
- 对原始上网日志数据进行初筛处理(由客户来处理,我们提供规则),因为全国的上网日志数据是特别大的,一天大概产生80-90T。所有先由客户初筛出我们需要的数据,我们做的汽车行业,就会只拿出汽车行业相关的数据推送给我们。