分析:R/SparkR/MLlib
文章平均质量分 55
大数据部
这个作者很懒,什么都没留下…
展开
-
mysqldump备份与还原数据操作
[Author]: kwu -- mysqldump备份与还原数据操作原创 2015-05-04 16:14:29 · 914 阅读 · 2 评论 -
【如何R实现聚类算法及3D可视化展示】:kmeans聚类方法在用户价值细分上的应用
Author : QQ Zhou 大家应该很熟悉RFM模型,这是在做用户价值细分常用的方法。主要涵盖的指标有R(Recency);消费频率(Frequency);消费金额(Monetary);RFM模型在用户价值细分上具有很强的解释性和可操作性。但以下为了展示R是如何聚类算法及可视化。我们姑且用R、F、M三个指标聚类得出具有实用性和解释性的结论。步骤一:以下是我们使用数据集cust_id fnd_rdm_amt_thr_mnt原创 2016-11-16 16:40:19 · 7917 阅读 · 0 评论 -
【R与聚类算法】:确定K值个数
在无监督学习中,很多朋友都会面临同一个问题,我们应该将用户聚成几类?即如何确定K值问题。下面我们介绍两种常用的方法。轮廓系数法Nbcluster轮廓系数法 首先,我们载入数据,并对数据进行预先处理。请看原创 2016-11-16 19:32:25 · 3005 阅读 · 0 评论 -
CentOS6安装与运行R脚本
[Author]: kwu --- R语言是常用的数据分析工具,本文介绍CentOS6安装与运行R脚本:原创 2015-08-20 18:06:32 · 2457 阅读 · 0 评论 -
sparkR集群启动脚本的封装
[Author]: kwu ---sparkR默认是以单机方式运行的。实现sparkR的集群启动,需要指定master地址,占用内存、CPU,及UI端口等,这对分析人员来说是比较麻烦的。如何实现对其启动的封装,方便分析人员来使用:原创 2015-08-29 22:18:08 · 2257 阅读 · 0 评论 -
基于spark1.4.1的sparkR的实例操作
[Author]: kwu ---基于spark1.4.1的sparkR的实例操作,sparkR的操作基本语法与R一致,其中添加了rJava、rhdfs、SparkR的依赖库的支持。原创 2015-08-30 15:14:18 · 2222 阅读 · 7 评论 -
基于CDH5.4的Spark1.4.1下SparkR的部署
[Author]: kwu --- 基于CDH5.4的Spark1.4.1下SparkR的部署,R与Spark的结合为数据分析提供高效的解决方案,Hadoop的中hdfs为数据分析提供分布式存储。本文介绍集成安装的步骤:原创 2015-08-29 14:17:24 · 2291 阅读 · 1 评论 -
谁在使用我的网站——用户忠诚和价值分析
谁在使用我的网站——用户忠诚和价值分析前面介绍的都是一些用户的行为指标和用户细分,这里要介绍的是基于每个用户行为的综合性的分析和评定,主要包括用户的忠诚度和用户的价值。“以用户为中心”的理论要求网站不断优化改善用户的体验,进而提升用户的满意度,当用户的预期不断被满足时,用户就会喜欢上这个网站,进而发展成为网站的忠诚用户,同时不断地为网站输出价值。忠诚用户不但自身为网站创造价值,而且可以为网站带转载 2015-08-25 16:22:13 · 1577 阅读 · 0 评论 -
Windows服务器下设置R脚本自动运行
[Author]: kwu --- Windows服务器下设置R脚本自动运行原创 2015-06-02 11:33:21 · 2687 阅读 · 1 评论 -
R中的含有千分位分隔符数值无法转换
Author: Lv Wenjuan步骤:1、先将逗号分隔符替换为空格2、再将空格用正则式替换> a<-"1,234.2"> b<-as.numeric(a)Warning message:NAs introduced by coercion > bchartr(","," ",a)> bgsub("[N ]","",b)> result<-as.numer原创 2015-05-29 17:32:25 · 2984 阅读 · 0 评论 -
R语言动态获取股票价格
Author: Lv Wenjuan可以调用新浪提供的接口步骤:一、获取关于股票价格的字符信息,以"sz002312"为例> urlhttp://hq.sinajs.cn/list=sz002312"> a> html> html[1] "var hq_str_sz002312=\"三泰控股,86.00,82.50,90.75,90.75,82.11,90.75,0原创 2015-05-29 17:12:46 · 2466 阅读 · 0 评论 -
R读.csv,.txt,xlsx文件
Author: Lv Wenjuan原创 2015-05-29 16:45:42 · 1556 阅读 · 0 评论 -
R与文件夹操作
[author:QQ Zhou]总结:***对文件夹的操作***dir.create()list.dirs()dirname()dir.exist() #判断该文件夹是否存在unlink() #删除***对文件进行操作list.files()file.create()file.edit() #如果该文件存在,会直接打开编辑界面,如果该文件夹不存在会先创建,再打开编辑,如:file.edit("script1.R", "script2.R") file.append(file1原创 2016-12-27 11:27:45 · 11068 阅读 · 1 评论