R语言
文章平均质量分 57
Lucky和小白
搬砖工,ML学渣
展开
-
[R]Rstudio中建立包含Rcpp的R包
目的:将cvxclustr包修改为自己需要的rocvxclustr包。 初步学习:Rstudio中建立包含Rcpp的R包。 过程不顺利:花了2天时间解决问题,主要是此方面相对系统的资料很少。1. 环境--安装Rtools 检查path是否有2个Rtools相关路径2. 入门1--- hello worldstep 1 : 在Rstudio界面, ...原创 2017-05-03 16:48:12 · 6310 阅读 · 2 评论 -
[R]指令总结-hclust层次聚类包
【R 层次聚类--hclust包】http://blog.csdn.net/sherrymi/article/details/38341185hclust(d, method = "complete", members=NULL)d为距离矩阵。method表示类的合并方法,有:single 最短距离法complete 最长距离法median 中间距...原创 2018-04-04 14:52:20 · 12638 阅读 · 0 评论 -
[R]指令总结-csv,txt,table
csv文件1)写入csv(1) write.csv(...)write.csv(b,"orl.csv",row.names=FALSE) #'b是一个矩阵,写入orl.csv文件缺点:不能设置col.names=FALSE,即列名为V1,V2,...... 如添加了col.names=FALSE,会报错!!! (2)解决方案:write.table() 参考链接http://r....原创 2018-04-04 14:53:37 · 659 阅读 · 0 评论 -
[R]指令总结-数组,向量,矩阵
统计一个向量中有几个01. set.seed(2015)2. x<-sample(0:2,100,replace=T)3. x4. sum(x==0)//sum(x==0)是正确的,因为x==0的运算结果是TURE or FALSE,TRUE代表1,这个相加正好就是为0的个数。5. #两种运算结果一样,或者6. length(which(x==0))返回数组最大值标号which.max(x...原创 2018-04-04 14:54:06 · 593 阅读 · 0 评论 -
[R]指令总结-集合
数据集合合并 1)纵向数据合并rbind: row变多了 【X:100*3, rbind(X,X):200*3】 横向数据合并cbind: col变多了 【X:100*3, cbind(X,X):100*6】 Take a sequence of vector, matrix or data-frame arguments and combine by columns or rows.2)mer...原创 2018-04-04 14:54:45 · 489 阅读 · 0 评论 -
[R]指令总结-数据框
【数据框】创建数据框:imgRGB <- data.frame( R = as.vector(img[,,1]), G = as.vector(img[,,2]), B = as.vector(img[,,3]) ) 读取数据框的某列:imgRGB $ R数据框的列名:colnames(imgRGB)...原创 2018-04-04 14:55:11 · 282 阅读 · 0 评论 -
[R]指令总结-工作空间
rm在R软件的使用过程中,工作空间容易很快变得杂乱。rm函数能永久地从工作空间中删除一个或多个对象:> rm(x)> rm(x,y,z)你甚至可以同时删除工作空间中所有的内容。rm函数中有一个list参数,它包含所有需要删除的变量名称。前面章节介绍过ls函数能返回所有变量名称,因此你可以通过结合rm函数与ls函数,删除工作空间中的所有变量:> ls()[1] "f" "x" "...原创 2018-04-08 19:25:22 · 1508 阅读 · 0 评论 -
[R]指令总结-绘图,读图
line() By using the line()statement instead, you can add new graph elements to an existing graph在已有的图上继续绘图,如:在散点图上绘制1条直线二维空间的2点之间画一条线段segments(x0, y0, x1 = x0, y1 = y0, col = par("fg"), lty = ...原创 2018-04-08 19:24:56 · 271 阅读 · 0 评论 -
[R]指令总结-基本运算,基本数据类型
均值,标准差,方差均值 mean()标准差 standard deviation -- sd()方差 variance -- var()整除、余数取整除:%/%取余数:%%向下取整floor(7.99999)=7向上取整ceiling(1.00001)=2四舍五入round(1.49999)=1 round(1.5)=2round(1.50001)=2查看数据类型class(x)m...原创 2018-04-08 19:25:35 · 4193 阅读 · 0 评论 -
[R]指令总结-Rstudio,R版本,R包
Rstudio是R的IDE,先安装R,再安装RStudio 参考链接:下载和安装R、RStudio【安装更新R版本】【参考】http://blog.leanote.com/post/qiukaino1/R%E8%AF%AD%E8%A8%80%E5%AD%A6%E4%B9%A0-%E5%A6%82%E4%BD%95%E6%9B%B4%E6%96%B0R%EF%BC%9F 利用R包进行升...原创 2018-04-04 14:51:29 · 9666 阅读 · 0 评论 -
[R]指令总结-内存分配
内存分配【参考】http://www.biostatistic.net/thread-3302-1-1.html【OS】1. 当前设置下操作系统能分配给R的最大内存 memory.size(NA) or memory.limit()2. 查看当前R已使用的内存 memory.size(F) 查看已分配的内存 memory.size(T)3. 扩大分配的内存 ...原创 2018-04-04 14:47:16 · 5302 阅读 · 0 评论 -
[R]指令总结[R instructions]
说明:个人使用R语言近2年,总结的常用指令。发现写到博客中,方便自己随时随地查看。 可以保存在txt文档中,使用查找功能进行搜索。不断更新中......1.line() By using the line()statement instead, you can add new graph elements to an existing graph2.均值 mean()标准差 st...原创 2017-11-16 17:16:52 · 5058 阅读 · 0 评论 -
[R]using R in Sublime Text2
前言:R语言在聚类中应用广泛,所以我义无反顾的选择它。但实验室就我1个人用,网上资料也很少。是时候针对走过的弯路和曾有过的探索,总结一番。在Rgui中直接编辑.R代码是1件不爽的事情,借助Sublime Text2更为方便。其实python等等,均可借助Sublime Text2进行编辑。主要教程 http://my.oschina.net/u/2306127/blog/4707651.安装pa...原创 2018-03-01 21:02:10 · 208 阅读 · 0 评论 -
[R][源码]EM算法实现基于高斯混合模型(GMM)的聚类
要求:用EM算法实现基于GMM的聚类算法。一、实验数据参考[1] 3.3.2章节。由两个二维高斯分布混合生成1000个数据,混合系数分别是0.4、0.6,均值和方差如下:mu1=[-2,-2]sigma1=[1.2, 0.5, 0.5, 1]mean2=[2,2]sigma2=[1.5, 0.7, 0.7, 1]二、实验过程、结果与分析2.1 数据散点图 2.2 用mclust包实现R语言自带mc...原创 2018-03-01 21:12:46 · 9078 阅读 · 1 评论 -
[R][源码]LDA文本模型(初级1)
Latent Dirichlet Allocation(LDA)是一个在文本建模中很著名的模型,可以用于浅层语义分析,在文本聚类中是一个很有用的模型。即在仅观察到文档词语的条件下,挖掘出文本所属的主题等一系列信息。要求:读取属于2个主题的多篇文章,进行相关分析。一、 数据本实验数据取自30篇论文的摘要部分,这些论文的主题为co-clustering或者CCA。用这30个txt文件...原创 2018-03-02 19:43:26 · 1204 阅读 · 0 评论 -
[R][源码]利用交叉验证选择最优聚簇数目
交叉验证主要用于建模应用中,即在给定的建模样本中,拿出大部分样本进行训练,留小部分样本在刚建立的模型上进行测试。在运行kmeans等聚类算法时需要设定聚类数目,但聚类数目一般难以预测,交叉验证可以解决这一问题。一、 数据选取R语言自带的iris数据集,共3个聚类。数据共150个,每个样本有4个特征。由于数据带有标号,故删去Species列。二、 实验过程、结果与...原创 2018-03-02 19:47:32 · 1480 阅读 · 0 评论 -
[R][源码]KNN算法
knn算法(最近邻算法)是一种用于分类和回归的非参数统计方法。knn算法的核心思想是“近朱者赤,近墨者黑”,本实验用knn算法实现了分类(某种意义上的聚类,如下图)。一、 算法描述: 假设共有N个数据点,度量任意两个数据点之间的距离,构成N*N距离矩阵。 数据划分为训练集和测试集,训练集数据标号已知,测试集数据标号未知。 对测试集中任一数据点,由距离矩阵求出训练集中(邻居取自已经正确...原创 2018-03-02 19:53:13 · 1929 阅读 · 0 评论 -
[R]指令总结-查看系统运行时间
查看系统运行时间的两种方法【法1】system.time()> system.time(apply(icol,1,sampnumberfunction))用户 系统 流逝0.16 0.01 0.17这是计算机操作系统中说明运算时间的概念,“用户”是消耗在应用程序(非操作系统部分)执行的时间,“系统”是底层操作系统执行(例如磁盘读写等)部分的时间,“流逝”是经过的总时间(可以认为是前两者的总和...原创 2018-04-04 14:44:54 · 7984 阅读 · 0 评论 -
[R]指令总结-调试
调试:【参考】1. http://blog.csdn.net/u013259893/article/details/412541772.《R语言编程艺术》 chapter 13【指令】1. debug(f) 从此时起,每次调用f,都会进入debug状态 undebug(f) 取消f的调试状态 debugonce 只调用一次debug(f) 2. f的某行加入brows...原创 2018-04-04 14:45:46 · 413 阅读 · 0 评论 -
[R]提高R语言速度
前言:R语言在聚类中应用广泛,所以我义无反顾的选择它。但实验室就我1个人用,网上资料也很少。是时候针对走过的弯路和曾有过的探索,总结一番。1. 参考《R语言编程艺术》(Norman Matloff)chapter 14 & chapter 152. 方法(1)向量化 与非向量化-循环做个对比:(2)R中调用C或cpp通过Rstudio建立R包,R包中可以联合使用cpp。仅拿...原创 2018-03-01 20:56:00 · 3738 阅读 · 0 评论