用户画像中挖掘类标签的生产过程

背景

在用户画像中,除了用户的性别年龄等基础标签,我们还可以使用机器学习算法挖掘一些标签,比如用户购买意向等标签

技术方案

挖掘类标签的生产一般有以下的流程图,主要包括特征选择,也就是选择用户的哪些行为作为特征,比如用户的消费明细和用户的年龄等特征,随后我们需要对特征进行处理,比如归一化数值特征,后续我们就可以训练机器模型进行训练了,这里的机器学习模型我们可以直接使用spark ml自带的,最后一步就是部署训练好的模型,整体架构如下所示:
在这里插入图片描述
附Spark ml模型训练的伪代码:

//训练数据
List<LabeledPoint> trainedData=;
//决策树模型
DecisionTreeClassifier treeClassifier;
// 训练模型
Model model = treeClassifier.fit(trainedData);
// 预测结果
model.transfer(testData)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值