自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

转载 绘制某一省份的地图,查找某一省份的ADCODE99代码

setwd("E:/中国GIS地图/国家基础地理数据")library("maptools")china_map=readShapePoly("bou2_4m/bou2_4p.shp")plot(china_map)plot(china_map,col=gray(924:0/924))此时,china_map中保存的是各个省 / 直辖市的多边形面图,数据类型是SpatialPolygonsData...

2018-04-30 21:24:56 4850

转载 SPSS做因子分析(非常细致的过程)

SPSS案例分析3:因子分析 因子分析在各行各业的应用非常广泛,尤其是科研论文中因子分析更是频频出现。小兵也凑个热闹,参考《SPSS统计分析》书中的案例,运用SPSS进行因子分析,作为我博客 SPSS案例分析系列  的第三篇文章。【一、概念】探讨具有相关关系的变量之间,是否存在不能直接观察到的,但对可观测变量的变化其支配作用的潜在因素的分析方法就是因子分析,也叫因素分析。通俗点:因子分析是寻找潜在...

2018-04-29 22:45:18 132889 13

原创 数据规约

主成分的计算步骤:主成分的代码实现:# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter4/示例程序")# 数据读取inputfile <- read.csv('./data/principal_component.csv', header = FALSE)# 主成分分析PCA <- princomp(inpu...

2018-04-26 23:00:52 5147

原创 数据集成、数据变换下的标准化(最小最大规范化、0均值规范化和小数定标规范化)和连续属性离散化(等宽法、等频法和聚类法)

       数据集成:是将储存咋两个数据框内的数据,以“关键词”为依据,以行为单位做列向合并,是通过merge()函数实现,基本形式:merge(数据框1,数据框2,by="关键字")。       但是在数据集成中可能会有这些问题出现:(1)同名异意:数据集A中的ID描述的是菜品单号,数据集B中的ID描述的是订单编号,则合并的话会出现问题。(2)异名同意:数据集A中的data描述的是日期,数据...

2018-04-24 21:50:52 8453

原创 比智商更重要的是逆商;纯净的心才能感受纯净的善良

2018-04-23 19:28:07 229

原创 人生需要耐心;20岁千万别太闲

2018-04-23 19:26:01 362 1

原创 解决此类问题,例:知道2006年6月和7月数据r,现在有12个2006年6月和29个2006年7月,怎么一次性全部填入r?

问题:想根据右边的利率标准,把利率按月份填到r列下。首先,在日期前新插入一列,并输入“=TEXT(B2,“YYYY/mm”)”,回车后就提取出日期的年份和月份。然后,把A列和E列复制到一个新Excel中,命名为a;把G列和H列复制到另一个新的Excel,命名为b,均放在F盘下。接着用R语言做处理,并输出结果,y列即为r列。setwd("F:")a=read.csv("a.csv")b=read.c...

2018-04-23 16:01:46 275

原创 数据缺失值和异常值的识别和填补(均值插补、回归插补、多重插补法)

如果异常值需要填补,则可把异常值当做缺失值一块填补。# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("E:/自己重要的文件/R语言个人分类总结/R语言数据分析与挖掘实战/图书配套数据、代码/chapter4/示例程序")# 读取销售数据文件,提取标题行inputfile <- read.csv('./data/catering_sale.csv'...

2018-04-21 23:19:41 65368 9

转载 多元回归与R语言实现

最近论文,刚好研究下R的回归分析。作此笔记,以便将来参考。1.读入数据,R-STUDIO直接有按钮,否则就> zsj <- read.csv("D:/Paper/data/zsj.csv")数据一般从excel的CSV或者txt里读取,实现整理好以符合R的数据框的结构ps1:这块有很多包提供从不同来源读取数据的方法,笔者还得慢慢学。。2.画相关图选择回归方程的形式> plot(Y...

2018-04-20 22:51:06 3214

转载 多元回归理论及R语言实现(转载基础上添加自己的新代码)

回归分析是研究两个变量之间的不确定性关系,考察变量之间的数量变化规律,通过回归方程的形式描述和反映这种关系,帮助人们挖掘出变量之间隐藏的规律。建立回归模型的一般过程为:1)建立理论回归模型2)估计模型参数3)回归模型检验4)模型诊断5)利用回归方程进行预测以下是RStudio实现过程:1、建立模型及显著性检验getwd()setwd("E:")A=read.csv("多元回归数据.csv")#读取...

2018-04-20 22:50:03 3145

转载 R语言的各种假设检验

R语言各种假设检验实例整理(常用)来源https://www.cnblogs.com/ywliao/archive/2017/04/17/6724334.html一、正态分布参数检验   例1. 某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知。现测得16只元件的寿命如下:                 159 280 101 212 224 379 179 264  ...

2018-04-20 22:01:27 18520 1

转载 用R语言做单方程的误差修正模型(ECM)

># 单方程误差修正模型案例分析> ###########################> # 数据的生成> set.seed(12345)> u<-rnorm(500)> x<-cumsum(u)#求累积和,返回一个变量,它的第i个元素是从U(1)到U(i)和。> y<-x+u> # E-G协整估计及检验> ...

2018-04-19 20:38:36 10196 3

原创 用R语言的ROC评价决策树和神经网络哪个更优

首先介绍一下几个基本概念:预测值为正例,记为P(Positive)预测值为反例,记为N(Negative)预测值与真实值相同,记为T(True)预测值与真实值相反,记为F(False)TP:预测类别是P(正例),真实类别也是PFP:预测类别是P,真实类别是N(反例)TN:预测类别是N,真实类别也是NFN:预测类别是N,真实类别是P所以,tpr就是真正例,fpr就是假正例ROC曲线是显示Classi...

2018-04-18 17:07:08 6175 4

原创 R语言构建决策树

# 构建CART决策树模型# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter6/示例程序")# 读取数据trainData <- read.csv("./data/trainData.csv")# 将class列转换为factor类型trainData <- transform(trainData, clas...

2018-04-17 22:36:56 1440

原创 R语言建立神经网络过程

# 神经网络模型构建# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter6/示例程序")# 读取数据trainData <- read.csv("./data/trainData.csv")# 将class列转换为factor类型,例,transform(数据集,要进行的操作)trainData <- tran...

2018-04-17 22:15:46 4063 1

原创 R语言中sample()的一些用法以及随机选择出测试样本和训练样本

根据样本数据随机选择20%做测试样本,80%做训练样本# 数据划分# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter6/示例程序")# 把数据分为两部分:训练数据、测试数据# 读入数据Data <- read.csv("./data/model.csv")# 数据命名colnames(Data) <- c("...

2018-04-17 21:47:08 34545

转载 最大似然法 的通俗理解

转自http://www.ccthere.com/article/1522559 最大似然法,英文名称是Maximum Likelihood Method,在统计中应用很广。这个方法的思想最早由高斯提出来,后来由菲舍加以推广并命名。       最大似然法是要解决这样一个问题:给定一组数据和一个参数待定的模型,如何确定模型的参数,使得这个确定参数后的模型在所有模型中产生已知数据的概率最大。通俗一点...

2018-04-16 23:16:03 4525

转载 如何利用R语言处理 缺失值 数据

主要用到VIM和mice包[plain] view plain copyinstall.packages(c("VIM","mice"))  1.处理缺失值的步骤步骤:(1)识别缺失数据;(2)检查导致数据缺失的原因;(3)删除包含缺失值的实例或用合理的数值代替(插补)缺失值缺失值数据的分类:(1)完全随机缺失:若某变量的缺失数据与其他任何观测或未观测变量都不相关,则数据为完全随机缺失(MCAR)...

2018-04-16 19:56:14 10298

原创 电力公司:拉格朗日插值法

怎么弥补缺失值?# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter6/示例程序") library(XLConnect)missing_data <- XLConnect::readWorksheetFromFile(file = "./data/missing_data.xls",                ...

2018-04-16 19:26:03 359 1

原创 电力公司:用R做两列不同数字的直方图和饼图以及趋势图

统计表内各行业分别有多少个?1 直方图setwd("E:/自己重要的文件/R语言个人分类总结/图书配套数据、代码/chapter6/示例程序")# 设置工作空间data_FB <- read.csv("./data/窃漏电用户分布分析.csv", header = TRUE)Type <- table(data_FB[, 3])p <- barplot(Type, space =...

2018-04-16 17:41:51 2070

原创 朋友不需要太多,真心就好;父母是孩子最好的老师

1.朋友不需要太多,真心就好2.父母是孩子最好的老师

2018-04-15 16:29:23 643

原创 .城市压力大以及如何减压;.承受委屈才能承受责任的文章

1.城市压力大以及如何减压的文章2.承受委屈才能承受责任

2018-04-15 16:22:59 319

原创 Excel/WPS做数据透视表,即对变量做交叉汇总(列联表)

编号性别家庭地区月生活费月衣物支出买衣服因素1男大城市800200价格2女小城市600180品牌3男中城市500110样式4男小城市900140价格5女中城市500200样式6男大城市600360品牌7女大城市1100650皮牌8男小城市6000200价格9女中城市700410样式注意:数据源的首行必须有列标题。1.选择插入-数据透视表,点击确定则会出现如下的数据透视表的初始状况。2.分别将右边的...

2018-04-15 15:45:10 17928

原创 利用Excel/WPS进行数字筛选,分别找出统计学成绩为75的人 ,英语成绩最高的前三名;四门功课都大于70的人

姓名统计学成绩数学英语经济学张松69688486王翔91759594田雨54886778李华81608664赵颖75968183问:1、找出统计学成绩为75的学生 2、英语成绩最高的前三名学生;3、四门功课都大于70的学生;一. 光标放在任意单元格,然后点击数据-筛选那么在第一行会出现如下的下拉箭头。点击统计学旁边的下拉箭头,然后点击数字筛选,下的“等于”,会出现如下对话框,输入75即可。二.点击...

2018-04-15 15:07:04 8650

转载 易行长指出了利率市场化”最后一枪“

【随笔】易行长指出了利率市场化”最后一枪“王剑今日,人行易纲行长在博鳌亚洲论坛2018年年会分论坛上问答有关提问,其中主持人问道:中国目前是否有上调基准利率的考虑? 这问题似乎是帮市场人士问的。因为市场人士已经争论这个问题很久了。 当然,和天底下所有的央行行长一样,易行长的回答也是不那么直接的。他说:中国正继续推进利率市场化改革。目前中国仍存在一些利率“双轨制”,一是在存贷款方面仍有基准利率,二是...

2018-04-13 21:31:30 397

原创 Excel如何将两个不同列的同一天的数值进行相加(方法二)

1.原始数据,但是有变量名称。2.选择 数据-合并计算,点击确定。3.会发现这次输出的结果同上一种方法输出的结果不同。日期列是保留了所有的日期,两个市值列中有空格的,是按等于“0”和另一列直接相加。有时我们需要这种加和结果但有时我们需要上一种方法得到的结果:如果两列中,有1列缺某一日期,那么就不计算该日期的加总和。...

2018-04-13 20:58:30 3649

原创 Excel如何将两个不同列的同一天的数值进行相加(方法一)

1.原始数据,想按对应日期进行加总数据(第一行日期不相等的情况下)2.点击数据-合并计算,把数据都选进去,并勾选“首行”“最左列”,点击确定。3.结果如下,发现第一行的数据日期对应不正确(因为原始数据第一行日期不相等),其他行都一一按日期正确对应。手动改正第一行即可。自己根据结果琢磨“首行”“最左列”的用途。4.删除第二列空格所在行,再删除第一列空格所在行。步骤:选中第二列,点击“定位”,并选择“...

2018-04-13 20:47:26 9844

原创 Excel中 如何每隔几行 插入一行

1.想在每年的年报这一行上插入一行(作为三季度)2.首先是在D5中输入1,包含1在内向下选中3列3.向下拖动鼠标,到没有内容的时候松开。4.打开 查找-定位,并勾选“常量”,之后会选中该列所有常量所在的行。5.右键鼠标,点插入 1行即可。6.确定后会插入需要的行,并命名“三季度”。...

2018-04-13 16:36:43 11740

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除