数据挖掘
文章平均质量分 53
心雨心辰
这个作者很懒,什么都没留下…
展开
-
了解推荐系统是什么
1.什么是推荐系统? 也许你不知道什么是推荐系统,但你肯定使用过。淘宝首页,有好货,猜你喜欢等,根据历史浏览记录,个性化推荐相似宝贝。 美团外卖,猜你喜欢。 网易云音乐,私人FM,每日推荐20首歌,推荐歌单等 电商购物、音乐、视频、新闻门户、社交平台好友、餐饮、旅游服务、招聘网以及相亲网等,都涉及推荐系统,推荐系统已经体现在生活的方方面面。2.推荐系统工作原理 利用物品,用户或用户对物品的原创 2016-07-15 11:11:48 · 650 阅读 · 0 评论 -
推荐算法之 slope one 算法
1.示例引入多个吃货在某美团的某家饭馆点餐,如下两道菜:可乐鸡翅: 红烧肉: 顾客吃过后,会有相关的星级评分。假设评分如下: 评分 可乐鸡翅 红烧肉 小明 4 5 小红 4 3 小伟 2 3 小芳 3 ? 问题:请猜测一下小芳可能会给“红烧肉”打多少分?原创 2016-07-15 12:03:30 · 21356 阅读 · 4 评论 -
anaconda2安装igraph
igraph的python 版本使用 http://igraph.org/python/doc/tutorial/install.html#installing-igraph 因为目前要求packages for Python 2.6, Python 2.7 and Python 3.2, 在我已安装anaconda2(基于Python 2.7的)的前提下,在cmd通过命令pip instal原创 2017-05-24 18:04:23 · 5526 阅读 · 1 评论 -
LR用户挖掘,如何选取阈值
在用逻辑回归做潜在用户挖掘时,阀值(Z)的选取是一个头疼的问题。取太高,查全率虽然高了,但是查询条件过于严格,挖掘出的潜在用户过少。取的太低,资源浪费的太多。对于一般的营销而言,这个问题很好解决,只要按照预算,从高往下选取就可以了。但对于其他没有预算约束的情况就比较麻烦。 希望下面的公式可以给予一些启发 Z=Ln((qc)/(QC)) q-发生显性结果的先验概率,比如信用卡用户发生违约的以往原创 2017-07-13 17:48:53 · 3303 阅读 · 0 评论 -
win7 anaconda2 安装xgboost
本人用python做数据分析,经常用到pandas,调用sklearn,于是偷个了小懒,直接安装了anaconda,它集成了很多python的工具包,安装也简单。 最近了解了一下GBM(gradient boosting machine),下面博客是一位寒小阳老师根据某次kaggle大赛上使用GBM处理赛事的流程。 http://blog.csdn.net/han_xiaoyang/artic原创 2016-11-22 17:33:43 · 3276 阅读 · 1 评论