R
文章平均质量分 79
sgyzetrov
【公众号:拖延果的日常】以前做过图像处理,而且做过不短的时间。做过C++、Java开发,深刻意识到兴趣是最好的老师...现在的方向是数据科学,认真地爱着,投入着......
展开
-
R_R语言做主成分分析
library(psych)mydata <- iris[,1:4]# 计算最优主成分个数mydata.screePlotsModel <- fa.parallel(mydata, fa="pc", n.iter=100, show.legend=F, main="崖底碎石图");# 主成分个数n=mydata.screePlotsModel$ncomp;# 主成分...转载 2018-03-10 10:29:53 · 1722 阅读 · 0 评论 -
DS&ML_分类算法笔记之随机森林、梯度提升树、XGBoost模型
对于以决策树为基础的模型的相关知识点的总结与整理XGBoost、随机森林RF、梯度提升树GBDT&GBRT简单描述一下这三类模型的思想,它们都是什么?对于以...原创 2018-04-02 09:10:17 · 4130 阅读 · 0 评论 -
DS&ML_分类算法笔记之k-近邻、KD-Tree模型
对于k-近邻、KD-Tree模型的相关知识点的总结与整理简单描述一下k-近邻的思想,KNN是什么?原创 2018-04-02 09:06:50 · 1607 阅读 · 0 评论 -
DS&ML_降维算法笔记之主成分分析PCA模型
对于主成分分析的相关知识点的总结与整理简单描述一下PCA的思想,PCA是什么?PCA是利用降维的思想,在损失较少信息的前提下,用几个综合指标来代替之前多个指标的一种多元统计方法,把这些综合指标称为主成分。核心就是把协方差矩阵特征值从大到小排列选出最大的K个组成特征向量矩阵。原创 2018-04-01 16:04:37 · 2010 阅读 · 0 评论 -
DS&ML_分类算法笔记之朴素贝叶斯模型
对于朴素贝叶斯模型的相关知识点的总结与整理简单描述一下朴素贝叶斯的思想,朴素贝叶斯是什么?朴素贝叶斯是一种分类算法,是贝叶斯分类算法的一种,贝叶斯分类算法都是以贝叶斯定理为基础的分类算法。与一般贝叶斯分类器的区别原创 2018-04-01 16:01:18 · 1910 阅读 · 0 评论 -
DS&ML_聚类算法笔记之k-means模型
对于k-means聚类模型的相关知识点的总结与整理简单描述一下k-means的思想,k-means是什么?原创 2018-04-01 11:21:04 · 2083 阅读 · 0 评论 -
DS&ML_分类算法笔记之决策树模型
对于决策树模型的相关知识点的总结与整理简单描述一下决策树模型的思想,决策树是什么?原创 2018-04-01 11:11:06 · 2977 阅读 · 0 评论 -
在集群环境中安装R(步骤清晰内容详实,堪称无脑教程!)
在集群环境下如何解决需要使用R语言的需求?关键词: PBS作业调度系统; HPC; R;本文最初思路构思于2018/05,成文于2018/10/17本文背景是博主的最新一篇论文(上位基因检测机器学习算法创新)临近实验尾声,已经完成在模拟数据中的检测,现在需要在真实数据上进行测试,奈何真实基因数据过于庞大,本地、单机的解决方案捉襟见肘,所以需要调用学院的集群来进行数据处理和运算。本文设定...原创 2018-10-17 20:36:33 · 4632 阅读 · 4 评论 -
DS&ML_分类算法笔记之支持自动机SVM模型
对于支持自动机SVM模型的相关知识点的总结与整理简单描述一下支持自动机的思想,SVM是什么?原创 2018-04-02 09:11:48 · 920 阅读 · 0 评论 -
DS&ML_关联分析笔记
对于关联分析模型的相关知识点的总结与整理简单描述一下关联分析的思想,关联分析是什么?原创 2018-04-02 11:51:32 · 2001 阅读 · 0 评论 -
R_2.创建数据集
2.1什么是数据集 数据集通常是由数据构成的一个矩阵数组。行为观测列为变量(统计学术语,在机器学习学科称行为示例example列为属性attribute)。 R中有很多用于存储数据的结构,包括标量,向量,数组,数据框和列表 R原生可以处理的数据类型包括数值型(numeric,integer)、字符型、布尔型(TRUE/FALSE)、复数型、原生型(字节) nu原创 2016-11-06 21:47:57 · 1643 阅读 · 0 评论 -
R_1.介绍与入门
1.1 数据的处理,理解和分析思路 获取数据(从各种数据源将数据导入程序)整理数据(编码缺省值、修复或删除错误数据、将变量转换成更方便的格式)注释数据(以记住每段数据的含义)总结数据(通过描述性统计量了解数据的概况)数据可视化(以直观图像代替描述)数据建模(解释数据间的关系,检验假设)整理结果(创建具有出版水平的表格和图形)1.2 R入门 1.2.1原创 2016-10-19 22:24:48 · 1046 阅读 · 0 评论 -
R_数据正态分布检验
使用R检测数据是否符合正态分布(正态分布检验) R语言正态检验; R语言QQ图; R语言概率密度曲线比较法;详细的方法介绍在网上已经有很多了,推荐这篇概括得来讲,主要分为4钟方法:概率密度曲线比较法Q-Q图法经验法则夏皮罗-威尔克(Shapiro-Wilk)检验法我使用R编写了一个示例函数,同时使用了概率密度曲线比较法、Q-Q图法和夏皮罗-威尔克(Shapiro-Wilk)检验法。至原创 2017-04-06 23:28:35 · 18165 阅读 · 0 评论 -
R_install.packages("xxx")报错Warning: unable to move temporary installation的解决办法
安装R包时报错Warning: unable to move temporary installation... 导致安装失败引用 http://stackoverflow.com/questions/5700505/windows-7-update-packages-problem-unable-to-move-temporary-installation解决办法: 关闭你的杀毒软件原创 2017-05-18 21:48:07 · 1614 阅读 · 0 评论 -
R_as.numeric()函数在转换小数时返回无意义结果的解决
本文重点解决as.numeric()函数将factor转为数值时得出的无意义结果的解决假设有数据框aaax | y | value ------------------------------------------a1 b2 0.510665432157769a2 b3 0.8876556785432...原创 2017-05-13 17:18:18 · 11776 阅读 · 1 评论 -
R_研究过程中积累的小技巧_entry 1
这是研究中积累的R语言相关的小技巧的第一篇总结博客 关键词: gsub; shell; names; cbind; append;需求1:一个41列的data frame(名为mydata)要改变最后一列的列名并需要将这一列移动到第一列的位置,而原来的第一列及其他依次后移。解法:names(mydata)[41]<-"ID"mydata<-cbind(mydata[41],mydata[,1原创 2017-12-01 00:37:46 · 1642 阅读 · 0 评论 -
R_处理我的一个txt文件的一点心得
使用R筛选txt中以特定字符结尾的行并生成新txt本来是想用R处理特定字符开头的行,但没有成功,当时已经觉得没戏了,R处理不了这个活,都要转去matlab/octave了,后来突然想到我要筛选的文件不光开头相同,结尾也相同啊!只是中间不同!!教训:正则表达式还没系统学习过,遇到问题只能先百度而不是先编程。对于R我果然还是新手。。需要处理的txt文件(节选)$ gy - Calling globals原创 2017-03-20 23:45:36 · 2237 阅读 · 0 评论 -
DS&ML_分类算法笔记之逻辑回归模型
对于逻辑回归模型的相关知识点的总结与整理简单描述一下逻辑回归的思想,逻辑回归是什么?逻辑回归虽然叫回归,但是其实是一种分类机器学习算法,原理是将数据拟合到一个预测logistic函数中,预测logistic函数的值表示取1的概率,而取0的概率就是(1-预测函数值),这样就完成对某些事件发生的概率的预测。简单地说,逻辑回归就是一个梯度下降。(Copyright © http://blog...原创 2018-03-27 13:55:14 · 1539 阅读 · 0 评论 -
R_C函数编译时输出警告“control reached end of...”的解决方法
解决R包开发过程中遇到的control reaches end of non-void function警告(错误)本文很短,主要是针对一个具体的警告进行举例解决。但是就这个系列本身来说,感觉自己开了一个大坑,没有信心填满的那种…问题背景本文是记录我之前在开发R包(未发布)的时候遇到的一个警告,以及解决方案,主要目的是日常笔记,其次是为了给遇到同样问题的朋友提供可行的思路。问题描述在R包...原创 2018-11-29 20:15:19 · 3259 阅读 · 0 评论