数据挖掘
莎朵dor
这个作者很懒,什么都没留下…
展开
-
数据挖掘的广告作弊行为分析
反作弊方法 反作弊方法1 基于异常值分析的方法 1.1 基于统计学的异常值检测 含义:数据集若服从正态分布,与均值之间的偏差达到或超过3倍标准差,可以对点击率,转化率,对话时间差进行分析 缺点:只能检测单个变量值,每次检测只能局限于单个指标 1.2 基于距离和密度的异常值检测 优点:可以结合多指标进行分析 1.3 基于偏差的异原创 2015-08-19 14:52:01 · 1530 阅读 · 1 评论 -
Python对商品属性进行二次分类并输出多层嵌套字典
用python预测二次分类的商品属于一级标签的概率,存储为字典,排序后输出来。说的有点绕,举个例子,用户搜索“snidle”,我们可以预测出它属于“女装”“女鞋”“食品”等n个一级分类的概率,这样可以锁定搜索范围。原创 2016-02-19 16:56:14 · 6736 阅读 · 0 评论