从游戏到用户分类

困境

最近在做Antispam的过程中,遇到了这样一个困境:当策略调整的太严格的时候,就容易伤害到很多正常用户,当策略太宽松的时候,就很容易漏掉很多垃圾用户,不过这样一个问题也是在早期就已经预料到随着spammer的成长必然会遇到的问题,只不过没想到会来的这么快,于是我们就开始想着,如何解决这种困境。

思路

解决这个问题的思路有两个

利用站上的业务数据,比如赞同感谢神马的给用户分级;
利用用户自己的行为,给用户分类。
第一个思路牵涉到的场景和业务相关性很强,每个网站使用起来参考性不大,但是第二个思路却是一个通用性的解决方法,我们就来聊聊第二个思路。

利用用户自己的行为给用户分类,广义的分类方法在机器学习上可分为监督方法和无监督方法,两种的区别在于,监督方法需要事先对于训练集给出标准答案,然后将标准答案输入到学习算法中,然后建立模型,处理后续的输入方法;而无监督学习,是事先没有标准答案,利用个体之间在输入数据上的相近程度,自然聚成一类。

通过以上的描述,可能无监督的学习方法更适合我们,因为我们实现不知道用户有几类,也没有标准答案。那么问题就来了,目前大多数聚类算法,原理大多数都是利用空间点中的相近程度,将点分成若干类,差别可能是,有的用的是欧几里得距离,有的用的是余弦距离,有的用的是空间密度分布而已,那么摆在我们面前一个急需解决的问题就是,如何将用户的行为量化,也就是映射到一个n维空间中,用来对用户进行聚类呢?

启发<

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值