自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Regression 算法

【定义】回归模型如下: y= f(x) + ε 其中,ε~N(0,σ^2) 其中,线性回归模型:y=X*β+ ε 其中,ε~N(0,σ^2*I)重要的求解除 f(x),解决的思想是:local average。有两种解决方法:(1)x 出发,做假设,f(x) = E(Y|X = x) 。(2)y 出发,做加权平均 ,f(x) = Σ wi(x) * yi ,其中

2016-02-03 13:55:33 749

原创 RFM模型及其用户运营实践

【背景介绍】网站付费用户在40万 +,目前只有针对新用户和流失客户(大客户部分)两大人群做专门运营活动,从开源和节流两个层面上保证付费盘子的扩大,但对于现金牛用户(除了新用户和流失客户)一般能触及到的就是全站营销活动,但试想网站格子市场相差如此之大(最贵格子7天置顶1288元,最便宜格子7天置顶5元),用户的消费能力也必然相差较大,不进行精细化运营很难保证营收的最大化。于是我们引入用户分层

2016-01-24 12:00:13 11226 1

原创 KNN 算法 python 实现

【概述】K-近邻算法采用不同特征值之间的距离方法进行分类。优点:精度高,对异常值不敏感,无数据输入假定;缺点:计算复杂度高,空间复杂度高;适用数据范围:数值型和标称型【实现原理】选择一种距离计算方式, 通过数据所有的特征计算新数据与已知类别数据集中的数据点的距离按照距离递增次序进行排序,选取与当前距离最小的k(一般不超过20)个点对于

2016-01-06 21:55:52 750

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除