- 博客(2)
- 收藏
- 关注
原创 Python对商品属性进行二次分类并输出多层嵌套字典
用python预测二次分类的商品属于一级标签的概率,存储为字典,排序后输出来。说的有点绕,举个例子,用户搜索“snidle”,我们可以预测出它属于“女装”“女鞋”“食品”等n个一级分类的概率,这样可以锁定搜索范围。
2016-02-19 16:56:14 6736
原创 数据挖掘的广告作弊行为分析
反作弊方法 反作弊方法1 基于异常值分析的方法 1.1 基于统计学的异常值检测 含义:数据集若服从正态分布,与均值之间的偏差达到或超过3倍标准差,可以对点击率,转化率,对话时间差进行分析 缺点:只能检测单个变量值,每次检测只能局限于单个指标 1.2 基于距离和密度的异常值检测 优点:可以结合多指标进行分析 1.3 基于偏差的异
2015-08-19 14:52:01 1530 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人