R学习
蔡军帅
好好学习,天天向上!
展开
-
R语言学习——R读取txt、csv、xls和xlsx格式文件
最近项目中运用到了R读取文件数据,所以把相关好用的、经过验证的方法总结了一下,有效避免下次入坑。1. R读取txt文件使用R读取txt文件直接使用read.table()方法进行读取即可,不需要加载额外的包。read.table("/home/slave/test.txt",header=T,na.strings = c("NA"))1注意,此处的na.strings...原创 2018-09-30 14:49:00 · 62020 阅读 · 1 评论 -
R语言学习——向量,矩阵
在R中,基本的数据结构有:向量,矩阵,数组,数据框,列表,因子,函数等。 向量:一系列同类型的有序元素构成。向量是一维结构。 向量是R最简单的数据结构,在R中没有标量。标量被看成1个元素的向量。 向量元素必须是同类型的。 由于向量是最简单的数据结构,因此本章中以向量为例子来解释各个概念。矩阵:二维的同类型元素的集合。矩阵由函数matrix创建。 矩阵需要输入...原创 2018-09-29 18:55:00 · 2322 阅读 · 0 评论 -
R语言学习——数据分析
complete.cases查看缺失值 箱图: 原创 2018-10-11 10:42:00 · 318 阅读 · 0 评论 -
R语言学习——数组
1、数组:数组是超过2维的相同元素的集合。 矩阵就是二维的数组。2、数组的创建 array函数来创建数组。3、元素的引用: 下标索引。 名字索引。 同维度逻辑对象筛选。 ...原创 2018-09-29 19:54:00 · 456 阅读 · 0 评论 -
R语言学习——条件筛选
原创 2018-09-29 19:05:00 · 13541 阅读 · 0 评论 -
R语言学习——因子
1、因子 因子的设计思想来源于统计学的名义变量,或称为分类变量。 分类变量的值本质上不是数字,而是对应为分类/分组。 因子分为无序因子和有序因子。因子的类别称为level,结合level,因子在内部被编码为指向level的正整数序号。函数str():Compactly Display the Structure of an Arbitrary R Object 回忆为了了解R ...原创 2018-09-30 14:17:00 · 1130 阅读 · 0 评论 -
R语言学习——列表
1、列表 列表是一种泛化的向量,其并没有要求所有元素都是同一类型,其元素甚至可为任意类型。 列表格式自由,为统计的计算结果的返回提供了极便利的方法。2、列表的创建 可以用list()函数创建列表。 模板:mylist<-list(name1=object1,…) 其中name可以省略3、元素的引用 列表通过双方括号提取其元素。 双方括号一次只能提取列表的一个组件。 单括...原创 2018-09-30 14:06:00 · 552 阅读 · 0 评论 -
R语言学习——输入与输出
导入数据:grades<-read.table("D:/ProgramData/test1.txt",sep="\t")求均值:mean()求方差:sd()保存数据:write.table(grades,"D:/ProgramData/test2.txt")> grades<-read.table("D:/ProgramData/test1....原创 2018-09-30 15:15:00 · 608 阅读 · 0 评论 -
R语言学习——循环判断语句
循环 判断函数函数是一个对象,可以赋值 函数要放在调用函数的前面输入输出read.csv()------文本文件 csv是comma separated value的英文缩写,其读取逗号分隔的文本文件。 read.csv()与read.table()的区别可以看他们的默认参数值。 read.table(file, header = FALSE, se...原创 2018-09-27 11:47:00 · 5586 阅读 · 0 评论 -
R语言学习——欧拉计划(11)Largest product in a grid
Problem 11In the 20×20 grid below, four numbers along a diagonal line have been marked in red.08 02 22 97 38 15 00 40 00 75 04 05 07 78 52 12 50 77 91 0849 49 99 40 17 81 18 57 60 87 17...原创 2018-09-29 00:51:00 · 209 阅读 · 0 评论 -
R语言学习——欧拉计划(1)Multiples of 3 and 5
【题目一】If we list all the natural numbers below 10 that are multiples of 3 or 5, we get 3, 5, 6 and 9. The sum of these multiples is 23.Find the sum of all the multiples of 3 or 5 below 1000.【翻...原创 2018-09-27 14:13:00 · 490 阅读 · 1 评论 -
R语言学习——数据框
创建数据框> patientID<-c(1,2,3,4)> age<-c(25,34,28,53)> diabates<-c("Type1","Type2","Type1","Type1")> statu<-c("Poor","Improved",&qu原创 2018-09-27 10:53:00 · 287 阅读 · 0 评论 -
R语言学习——欧拉计划(3)Largest prime factor 求最大质因数
The prime factors of 13195 are 5, 7, 13 and 29. What is the largest prime factor of the number 600851475143 ? 翻译过后如下: 找出一个合数的最大质数因子 13195的质数因子有5,7,13和29. 600851475143的...原创 2018-09-28 19:50:00 · 1004 阅读 · 0 评论 -
R语言常用包简介
原创 2019-07-10 11:47:00 · 875 阅读 · 0 评论 -
R语言 实验三 数据探索和预处理
计算缺失值个数 计算缺失率 简单统计量:计算最值 箱形图分析 分布分析:画出频率直方图 统计量分析:对于连续属性值,求出均值原创 2018-10-25 00:13:00 · 1395 阅读 · 0 评论 -
R语言与概率统计(六) 主成分分析 因子分析
超高维度分析,N*P的矩阵,N为样本个数,P为指标,N<<PPCA:抓住对y对重要的影响因素主要有三种:PCA,因子分析,回归方程+惩罚函数(如LASSO)为了降维,用更少的变量解决问题,如果是二维的,那么就是找到一条线,要使这些点再线上的投影最大,投影最大,就是越分散,就考虑方差最大。>...原创 2019-07-11 11:48:00 · 332 阅读 · 0 评论 -
复杂统计方法R语言——简单回归
简单回归数据来源:http://www.statsci.org/data/general/cofreewy.html1.读入数据setwd("D:/数学建模/寒假美赛集训/R统计")w=read.table("COfreewy.txt",header=T,encoding = "utf-8")2.线性回归a=lm(CO~.,w)#a=lm(CO~Traff...原创 2020-01-16 11:11:00 · 350 阅读 · 0 评论 -
R语言与概率统计(五) 聚类分析
#########################################0808聚类分析X<-data.frame( x1=c(2959.19, 2459.77, 1495.63, 1046.33, 1303.97, 1730.84, 1561.86, 1410.11, 3712.31, 2207.5...原创 2019-07-11 10:33:00 · 301 阅读 · 0 评论 -
R语言与概率统计(三) 多元统计分析(下)广义线性回归
广义线性回归> life<-data.frame(+ X1=c(2.5, 173, 119, 10, 502, 4, 14.4, 2, 40, 6.6, + 21.4, 2.8, 2.5, 6, 3.5, 62.2, 10.8, 21.6, 2, 3.4, + 5.1, 2.4, 1.7, 1.1, 12.8, 1.2, ...原创 2019-07-10 15:58:00 · 519 阅读 · 0 评论 -
R语言与概率统计(四) 判别分析(分类)
Fisher就是找一个线L使得组内方差小,组间距离大。即找一个直线使得d最大。####################################1、判别分析,线性判别:2、分层抽样#install.packages('MASS')library(MASS)#install.packages('sampling')library...原创 2019-07-11 09:13:00 · 495 阅读 · 0 评论 -
R语言与概率统计(三) 多元统计分析(中)
模型修正#但是,回归分析通常很难一步到位,需要不断修正模型###############################6.9通过牙膏销量模型学习模型修正toothpaste<-data.frame( X1=c(-0.05, 0.25,0.60,0, 0.25,0.20, 0.15,0.05,-0.15, 0.15, 0.20, 0.10,0.40,0.45,0....原创 2019-07-10 15:48:00 · 902 阅读 · 0 评论 -
R语言与概率统计(三) 多元统计分析(上)
> #############6.2一元线性回归分析> x<-c(0.10,0.11,0.12,0.13,0.14,0.15,0.16,0.17,0.18,0.20,0.21,0.23)> y<-c(42.0,43.5,45.0,45.5,45.0,47.5,49.0,53.0,50.0,55.0,55.0,60.0)> pl...原创 2019-07-10 14:41:00 · 910 阅读 · 0 评论 -
R语言——实验4-人工神经网络(更新中)
带包实现:rm(list=ls())setwd("C:/Users/Administrator/Desktop/R语言与数据挖掘作业/实验4-人工神经网络")Data=read.csv("sales_data.csv")[,2:5]library(nnet)colnames(Data)<-c("x1","x2","x3","y")原创 2018-11-08 11:47:00 · 790 阅读 · 0 评论 -
R语言与概率统计(二) 假设检验
> ####################5.2> X<-c(159, 280, 101, 212, 224, 379, 179, 264,+ 222, 362, 168, 250, 149, 260, 485, 170)> t.test(X,alternative='greater',mu=225,conf.level = 0.95...原创 2019-07-10 13:22:00 · 772 阅读 · 0 评论 -
R语言学习——根据信息熵建决策树KD3(还在更新中)
R语言代码 rm(list=ls()) setwd("C:/Users/Administrator/Desktop/R语言与数据挖掘作业/实验3-决策树分类") inputfile=read.csv(file="./bank-data.csv",header=TRUE) #age 原创 2018-10-27 17:04:00 · 483 阅读 · 0 评论 -
R语言—使用函数sample进行抽样
在医学统计学或者流行病学里的现场调查、样本选择经常会提到一个词:随机抽样。随机抽样是为了保证各比较组之间均衡性的一个很重要的方法。那么今天介绍的第一个函数就是用于抽样的函数sample: > x=1:10 &原创 2018-11-13 12:36:00 · 4050 阅读 · 0 评论 -
R语言——实验5-聚类分析
针对课件中的例子自己实现k-means算法调用R语言自带kmeans()对给定数据集表示的文档进行聚类。给定数据集: a) 数据代表的是文本信息。b) 第一行代表词语,由于保密原因,词语已经被转意。第一列代表了文本的编号。c) 红框中的数字为对应词的词频。共113个样本,用K-Means算法将样本分为...原创 2018-11-29 11:00:00 · 2369 阅读 · 0 评论 -
R语言—统计结果输出至本地文件方法总结
1.sink()在代码开始前加一行:sink(“output.txt”),就会自动把结果全部输出到工作文件夹下的output.txt文本文档。这时在R控制台的输出窗口中是看不到输出结果的。代码结束时用sink()切换回来。 示例: sink("a.txt") x<-rnorm(100,0,1) ...原创 2018-10-27 20:14:00 · 4787 阅读 · 0 评论 -
用R语言实现对不平衡数据的四种处理方法
https://www.weixin765.com/doc/gmlxlfqf.html在对不平衡的分类数据集进行建模时,机器学**算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性那么,这种结果是为何发生的呢?到底是什么因素影响了这些算法的表现? 在不平衡的数据中,任一算法都没法从样本量少的类中获取足够的信息来进行精确预测因此,机器学**算法常常被要...原创 2018-12-15 00:53:00 · 7760 阅读 · 4 评论 -
R语言——实验4-人工神经网络
带包实现:rm(list=ls())setwd("C:/Users/Administrator/Desktop/R语言与数据挖掘作业/实验4-人工神经网络")Data=read.csv("sales_data.csv")[,2:5]library(nnet)colnames(Data)<-c("x1","x2","x3","y")model1...原创 2018-11-08 11:47:00 · 448 阅读 · 0 评论 -
R语言与概率统计(一) 描述性统计分析
查看运行结果:#查看已安装的包,查看已载入的包,查看包的介绍########例题3.1#向量的输入方法w<-c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7, 63.5, 66.6, 64.0, 57.0, 69.0, 56.9, 50.0, 72.0)plot(w)#概况,数据的可视化可以让我们看的更轻松...原创 2019-07-10 09:37:00 · 1999 阅读 · 0 评论 -
R语言——矩阵常用的操作(笔记)
https://blog.csdn.net/yijiaobani/article/details/78880004 原创 2018-11-13 13:07:00 · 1011 阅读 · 0 评论 -
R语言学习——根据信息熵建决策树KD3
R语言代码决策树的构建rm(list=ls())setwd("C:/Users/Administrator/Desktop/R语言与数据挖掘作业/实验3-决策树分类")#save printsink("tree1.txt") inputfile=read.csv(file="./bank-data.csv",header=TRUE)...原创 2018-10-27 17:04:00 · 634 阅读 · 0 评论