R语言
文章平均质量分 72
hellolijunshy
记录自己的日常操作。南开大学博士,统计学本硕。
展开
-
电力公司:用R做两列不同数字的直方图和饼图以及趋势图
统计表内各行业分别有多少个?1 直方图setwd("E:/自己重要的文件/R语言个人分类总结/图书配套数据、代码/chapter6/示例程序")# 设置工作空间data_FB <- read.csv("./data/窃漏电用户分布分析.csv", header = TRUE)Type <- table(data_FB[, 3])p <- barplot(Type, space =...原创 2018-04-16 17:41:51 · 2070 阅读 · 0 评论 -
多元回归理论及R语言实现(转载基础上添加自己的新代码)
回归分析是研究两个变量之间的不确定性关系,考察变量之间的数量变化规律,通过回归方程的形式描述和反映这种关系,帮助人们挖掘出变量之间隐藏的规律。建立回归模型的一般过程为:1)建立理论回归模型2)估计模型参数3)回归模型检验4)模型诊断5)利用回归方程进行预测以下是RStudio实现过程:1、建立模型及显著性检验getwd()setwd("E:")A=read.csv("多元回归数据.csv")#读取...转载 2018-04-20 22:50:03 · 3147 阅读 · 0 评论 -
多元回归与R语言实现
最近论文,刚好研究下R的回归分析。作此笔记,以便将来参考。1.读入数据,R-STUDIO直接有按钮,否则就> zsj <- read.csv("D:/Paper/data/zsj.csv")数据一般从excel的CSV或者txt里读取,实现整理好以符合R的数据框的结构ps1:这块有很多包提供从不同来源读取数据的方法,笔者还得慢慢学。。2.画相关图选择回归方程的形式> plot(Y...转载 2018-04-20 22:51:06 · 3214 阅读 · 0 评论 -
数据缺失值和异常值的识别和填补(均值插补、回归插补、多重插补法)
如果异常值需要填补,则可把异常值当做缺失值一块填补。# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("E:/自己重要的文件/R语言个人分类总结/R语言数据分析与挖掘实战/图书配套数据、代码/chapter4/示例程序")# 读取销售数据文件,提取标题行inputfile <- read.csv('./data/catering_sale.csv'...原创 2018-04-21 23:19:41 · 65389 阅读 · 9 评论 -
数据规约
主成分的计算步骤:主成分的代码实现:# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter4/示例程序")# 数据读取inputfile <- read.csv('./data/principal_component.csv', header = FALSE)# 主成分分析PCA <- princomp(inpu...原创 2018-04-26 23:00:52 · 5147 阅读 · 0 评论 -
因子变量 删除某一因子或只剩下某一因子数据
uspopage=read.csv("E://shuju.csv")uspopage #导入数据library(dplyr)uspopage2 = filter(uspopage, country !='中国')uspopage2 #去除“中国”后剩下的数据(如下)library(dplyr)uspopage2 = filter(uspopage, country =='中国')uspopage...原创 2018-06-01 19:53:45 · 1484 阅读 · 0 评论 -
R语言:根据经纬度在世界地图上画出各个点
“ljs.csv”的文件内容:mydata<-read.table("ljs.csv",header=TRUE,sep=",") #导入自己的名字为“ljs.csv”文件visit.x<-mydata$longitudevisit.y<-mydata$latitude #数据准备library(ggplot2)library(ggmap)libr...原创 2018-09-15 16:25:14 · 23654 阅读 · 16 评论 -
R语言:画树图
原始数据长这样:“iyear”表示年份;“nkill”表示死亡人数;“region”表示地区;“总计”表示某年份死亡总人数;nkii里的缺失数据自动按“0”运算。数据存储在名为“ljs”的csv格式里。 应提前下载好treemap包,先介绍treemap函数的用法:treemap(dtf, index, vSize, vColor = NULL, stdErr = NULL...原创 2018-09-22 20:30:00 · 5791 阅读 · 2 评论 -
R语言做面板VAR例子
面板VAR步骤:(1)对各变量做平稳性检验(IPS、PP、ADF、LLC等方法检验)是逐个变量检验??还是一起检验??(2)面板数据的最优滞后阶数确定(AIC和SIC方法)(3)在PVAR系统中进行Wald-Granger检验(4)面板VAR估计(5)脉冲效应(6)面板方差分解R语言例子:文件pvar.csv数据结构如下:数据包括4个内生变量("...原创 2018-11-23 17:19:28 · 10968 阅读 · 9 评论 -
R语言的各种假设检验
R语言各种假设检验实例整理(常用)来源https://www.cnblogs.com/ywliao/archive/2017/04/17/6724334.html一、正态分布参数检验 例1. 某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 ...转载 2018-04-20 22:01:27 · 18523 阅读 · 1 评论 -
数据集成、数据变换下的标准化(最小最大规范化、0均值规范化和小数定标规范化)和连续属性离散化(等宽法、等频法和聚类法)
数据集成:是将储存咋两个数据框内的数据,以“关键词”为依据,以行为单位做列向合并,是通过merge()函数实现,基本形式:merge(数据框1,数据框2,by="关键字")。 但是在数据集成中可能会有这些问题出现:(1)同名异意:数据集A中的ID描述的是菜品单号,数据集B中的ID描述的是订单编号,则合并的话会出现问题。(2)异名同意:数据集A中的data描述的是日期,数据...原创 2018-04-24 21:50:52 · 8453 阅读 · 0 评论 -
电力公司:拉格朗日插值法
怎么弥补缺失值?# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter6/示例程序") library(XLConnect)missing_data <- XLConnect::readWorksheetFromFile(file = "./data/missing_data.xls", ...原创 2018-04-16 19:26:03 · 359 阅读 · 1 评论 -
如何利用R语言处理 缺失值 数据
主要用到VIM和mice包[plain] view plain copyinstall.packages(c("VIM","mice")) 1.处理缺失值的步骤步骤:(1)识别缺失数据;(2)检查导致数据缺失的原因;(3)删除包含缺失值的实例或用合理的数值代替(插补)缺失值缺失值数据的分类:(1)完全随机缺失:若某变量的缺失数据与其他任何观测或未观测变量都不相关,则数据为完全随机缺失(MCAR)...转载 2018-04-16 19:56:14 · 10300 阅读 · 0 评论 -
R语言中sample()的一些用法以及随机选择出测试样本和训练样本
根据样本数据随机选择20%做测试样本,80%做训练样本# 数据划分# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter6/示例程序")# 把数据分为两部分:训练数据、测试数据# 读入数据Data <- read.csv("./data/model.csv")# 数据命名colnames(Data) <- c("...原创 2018-04-17 21:47:08 · 34545 阅读 · 0 评论 -
R语言建立神经网络过程
# 神经网络模型构建# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter6/示例程序")# 读取数据trainData <- read.csv("./data/trainData.csv")# 将class列转换为factor类型,例,transform(数据集,要进行的操作)trainData <- tran...原创 2018-04-17 22:15:46 · 4063 阅读 · 1 评论 -
R语言构建决策树
# 构建CART决策树模型# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter6/示例程序")# 读取数据trainData <- read.csv("./data/trainData.csv")# 将class列转换为factor类型trainData <- transform(trainData, clas...原创 2018-04-17 22:36:56 · 1440 阅读 · 0 评论 -
用R语言的ROC评价决策树和神经网络哪个更优
首先介绍一下几个基本概念:预测值为正例,记为P(Positive)预测值为反例,记为N(Negative)预测值与真实值相同,记为T(True)预测值与真实值相反,记为F(False)TP:预测类别是P(正例),真实类别也是PFP:预测类别是P,真实类别是N(反例)TN:预测类别是N,真实类别也是NFN:预测类别是N,真实类别是P所以,tpr就是真正例,fpr就是假正例ROC曲线是显示Classi...原创 2018-04-18 17:07:08 · 6177 阅读 · 4 评论 -
解决此类问题,例:知道2006年6月和7月数据r,现在有12个2006年6月和29个2006年7月,怎么一次性全部填入r?
问题:想根据右边的利率标准,把利率按月份填到r列下。首先,在日期前新插入一列,并输入“=TEXT(B2,“YYYY/mm”)”,回车后就提取出日期的年份和月份。然后,把A列和E列复制到一个新Excel中,命名为a;把G列和H列复制到另一个新的Excel,命名为b,均放在F盘下。接着用R语言做处理,并输出结果,y列即为r列。setwd("F:")a=read.csv("a.csv")b=read.c...原创 2018-04-23 16:01:46 · 275 阅读 · 0 评论 -
绘制某一省份的地图,查找某一省份的ADCODE99代码
setwd("E:/中国GIS地图/国家基础地理数据")library("maptools")china_map=readShapePoly("bou2_4m/bou2_4p.shp")plot(china_map)plot(china_map,col=gray(924:0/924))此时,china_map中保存的是各个省 / 直辖市的多边形面图,数据类型是SpatialPolygonsData...转载 2018-04-30 21:24:56 · 4851 阅读 · 0 评论 -
用R语言做单方程的误差修正模型(ECM)
># 单方程误差修正模型案例分析> ###########################> # 数据的生成> set.seed(12345)> u<-rnorm(500)> x<-cumsum(u)#求累积和,返回一个变量,它的第i个元素是从U(1)到U(i)和。> y<-x+u> # E-G协整估计及检验> ...转载 2018-04-19 20:38:36 · 10197 阅读 · 3 评论 -
R语言:线性规划问题求解
线性规划求解:这里是用到R语言里的Rglpk包Rglpk包中主要的函数有:Rglpk_solve_LP((obj, mat, dir, rhs, bounds = NULL, types = NULL, max = FALSE,control = list(), ...))其中参数及其作用见下表:obj a numeric vector representing t...原创 2019-04-01 21:53:52 · 10482 阅读 · 0 评论