- 博客(3)
- 收藏
- 关注
转载 推荐系统
推荐系统的本质是什么?比如说我们看到手机淘宝首页,往下一拉,就能看到各种各样推荐的商品;比如说百度,它会给我们推荐广告,在某种程度上他的工作方式也很像推荐系统;再比如说今日头条,今日头条从数十万的新闻中选出会被我们看到的数十个新闻,这也是推荐系统。尽管我们在生活中会已经见过非常多的推荐系统,但是在用机器学习搭建推荐系统之前,我们还是应当先思考一下,推荐系统要解决的到底是
2017-08-25 14:59:39 788
转载 混合型数据聚类(R)
利用聚类分析,我们可以很容易地看清数据集中样本的分布情况。以往介绍聚类分析的文章中通常只介绍如何处理连续型变量,这些文字并没有过多地介绍如何处理混合型数据(如同时包含连续型变量、名义型变量和顺序型变量的数据)。本文将利用 Gower 距离、PAM(partitioning around medoids)算法和轮廓系数来介绍如何对混合型数据做聚类分析。----------------------
2017-08-23 15:54:04 2295
转载 spaarkr 的使用
日前,Rstudio公司发布了sparklyr包。该包具有以下几个功能:实现R与Spark的连接—sparklyr包提供了一个完整的dplyr后端筛选并聚合Spark数据集,接着在R中实现分析与可视化利用Spark的MLlib机器学习库在R中实现分布式机器学习算法可以创建一个扩展,用于调用Spark API。并为Spark的所有包集提供了一个接口未来在RStudio IDE中集成支持Spa
2017-08-23 15:46:38 398
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人