自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Python对商品属性进行二次分类并输出多层嵌套字典

用python预测二次分类的商品属于一级标签的概率,存储为字典,排序后输出来。说的有点绕,举个例子,用户搜索“snidle”,我们可以预测出它属于“女装”“女鞋”“食品”等n个一级分类的概率,这样可以锁定搜索范围。

2016-02-19 16:56:14 6736

原创 数据挖掘的广告作弊行为分析

反作弊方法 反作弊方法1 基于异常值分析的方法 1.1 基于统计学的异常值检测 含义:数据集若服从正态分布,与均值之间的偏差达到或超过3倍标准差,可以对点击率,转化率,对话时间差进行分析 缺点:只能检测单个变量值,每次检测只能局限于单个指标 1.2 基于距离和密度的异常值检测 优点:可以结合多指标进行分析 1.3 基于偏差的异

2015-08-19 14:52:01 1530 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除