自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

转载 R语言-循环产生变量名并赋值,应用到 ggolot2 循环作图

问题的起源来自,想要批量出数十张组合好的图。实现过程中,最大的问题是如何实现:循环产生变量名,并对其将ggplot的一长段作图代码传送给该变量名。最终使用assign函数解决了首先产生1000个字符串格式的备用变量名:p <- c(paste0('p',1:1000))接下来,只需写个循环即可。for (i in 1:1000) {...

2018-11-07 11:53:00 3004

转载 工作总结-基于R的数据分析

终于有那么一丢丢时间,可以来把关于R语言编程的工作梳理一下。总体来说,工作内容主要是将公司已有的excel模板的数据分析内容转为R语言形式,目前写了四个产品的数据清洗和分析代码。在这中间,学习到了很多新知识。对接下来,编程之路的走向有了初步的规划。对数据分析这块也增加了认识吧。关于新知识:1、较大数据的处理来说,学习了data.table包,感觉是非常强大的。所做的工...

2018-10-16 18:13:00 275

转载 R语言_读取大数据

首选方法:使用data.table包中的fread函数:fread(input, file, sep="auto", sep2="auto", dec=".", quote="\"", nrows=Inf, header="auto", na.strings=getOption("datatable.na.strings","NA"), # due ...

2018-10-11 13:34:00 804

转载 Excel到R中的日期转换

首先描述一下这次遇到的问题:EXCEL中的日期显示格式为“年月日时分秒”,但直接使用openxlsx包中的read.xlsx函数读入时,该格式会自动转为数值,如:在excel中:在R中:此时数据不能用于计算时间差和日期差等,因此要转为正常的日期格式方可进行计算。解决方案有两种:方案1:加载readxl包,使用其中的read_excel()函数,可...

2018-08-14 18:37:00 3427

转载 利用scale函数得到均值、标准差

## 通常使用scale函数可以直接得到Z分数 ##x <- scale(data)## 需要均值标准差时,直接可以在输出里看到 ##scale(data)## 如果想取出均值标准差 ##mean <- attr(x,'scaled:center')std <- attr(x,'scaled:scale')转载于:h...

2018-08-09 13:16:00 1008

转载 SPSS和EXCEL的百分等级

今天纠结了一天的百分等级问题,现整理一下纠结成果:由于Excel算出来的百分等级低于SPSS中的数值,因此开始了找原因的漫漫长路后来搜索过程中,使用R中的:rank(m1)/length(m1) ## 与spss一致,采用序位中值 此时计算的结果和SPSS一致后来发现dplyr包中有个函数叫,percent_rank()这个函数算出来的百分等级和Exc...

2018-05-18 18:17:00 1232

转载 Excel中_ vlookup,筛选最大值并赋新值,百分位数

vlookup:用于匹配一列数据中于另一列数据中是否有同样的字符串,并可以将另一列数据中相同字符串的后一列变量的数值填入当前列。=VLOOKUP(A2,AG:AH,2,0)在AG:AH中筛选A2,0代表精确筛选,1代表模糊筛选,2代表赋值搜索区域的第二列数据。筛选最大值:=IF(MAX(AB2:AF2)=AB2,1,0)如果AB2-AF2中的最大值为AB2,则赋值...

2018-05-17 20:43:00 1036

转载 R 合并图片_组图

library(ggplot2)library(grid)library(gridExtra)library(openxlsx)library(tidyr)library(scales)i=1 #第一幅图#每一个i代表一个分组变量,意味着将同一个分组内的不同类别的数据分别作图,也就是p1,p2,p3 p1 <- ggplot(data3,aes(x=...

2018-05-14 21:02:00 655

转载 ggplot2 “高定图片”的具体参数设置

library(ggplot2)library(grid)library(gridExtra)library(openxlsx)library(tidyr)library(scales) ##此包在转换百分比数据时使用setwd("F:/~系统用户文件/Desktop/周五")data_raw <- read.xlsx("数据1.xlsx",she...

2018-05-14 20:37:00 538

转载 Repo&git (转载)

1.1清单库文件介绍一个清单库可以包含多个清单文件和多个分支,每个清单文件和分支都有对应的版本。清单文件以xml格式组织的。举个例子:remote元素,定义了名为korg的远程版本库,其库的基址为git://172.16.1.31/default元素,设置各个项目默认远程版本库为korg,默认的的分支为gingerbread-exd...

2017-09-05 09:51:00 137

转载 MAC OS X 常用命令(转载)

今天小研究了一下MAC的终端命令,主要为了方便调试程序用,XCODE用不来啊。。。在这里记下。。防止丢失pwd      当前工作目录cd(不加参数)  进rootcd(folder)  进入文件夹cd ..      上级目录cd ~      返回rootcd -      返回上一个访问的目录rm 文件名     删除cat 文件名(|less)...

2017-09-04 13:27:00 116

转载 ggplot2 自动循环作图

核心思想是 全程使用list数据要整理为以下格式> head(JG) itemID option correct 0.05 0.1 0.15 0.25 0.35 0.45 0.55 0.6 0.7 0.75 0.8 0.85 0.9 0.95 11 NR000527 A A 12.5 8.3 5.3 13 0...

2017-08-28 18:48:00 2912

转载 8月工作code总结

setwd("C:/Users/me/Desktop/8月22")###### 加载需要的包 #######library(CTT)library(openxlsx)library(dplyr)library(tidyr)library(difR)source('C:\\Users\\me\\Desktop\\8月22\\difmh.R',local=TR...

2017-08-28 18:23:00 131

转载 使用ggplot2循环画图并存图。

CF <- split(JG,JG$itemID) #将数据框按题目分割,每个题目做一个图for(i in 1:40){ #i=4 ############################## grid作图用 TM <- as.data.frame(CF[i]) colnames(TM) <- names(JG) TM <- ...

2017-08-14 11:52:00 3122

转载 工作小结 8.10

不知不觉,实习近一个月了,这期间,写了一套数据分析代码,初步学习了利用hugo建个人blog,虽然还没建起来。。。学习了他人的code,发现自己在写代码中有一些不好的毛病:不能打开脑洞使用更多方便的函数或者命令。因此现总结一下自己平时不习惯用的但是非常实用的命令,争取以后写code时消化进去。首先是data.frame:1、data$.. replac...

2017-08-10 15:24:00 130

转载 chi-square test & T-test & F-test & correlation-analysis

Without other qualification, 'chi-squared test' often is used as short for Pearson's chi-squared test.A chi-squared test can be used to attempt rejection of the null hypothesis that the data are ...

2017-05-27 19:24:00 969

转载 分层贝叶斯学习

频率推理(Frequentist inference is a type of statistical inference that draws conclusions from sample data by emphasizing the frequency or proportion of the data. An alternative name is frequentist st...

2017-05-17 17:34:00 663

转载 极大似然估计与方差

相关概念:极大似然估计,score function,Fisher informationLet f(X; θ) be the probability density function (or probability mass function) for X conditional on the value of θ. This is also the likelihood func...

2017-05-14 17:24:00 3534

转载 ggplot2:画世界地图和中国地图 合并数据 增添信息 标记

世界地图:library(maps)data("world.cities")bigcities <- subset(world.cities, pop > 5000000)qplot(long, lat, data = bigcities,colour=country.etc,size=pop)+ borders("world", size= 0.5)...

2017-04-27 21:05:00 1288

转载 ggplot2 增添数据 图上添加信息 时间线背景分区

向原有线中增添数据,加入人的信息(unemp <- qplot(date, unemploy, data=economics, geom="line", xlab = "", ylab = "No. unemployed (1000s)")) ## 基础图层presidential <- presidential[-(1:3), ] ##只保存...

2017-04-27 21:02:00 464

转载 ggplot2 ggplot() 分组回归,分组填充柱形图,设置stat_xxx,增添残差回归图层

dplot <- ggplot(diamonds, aes(clarity, fill = cut)) ##按cut类 计数填充dplot + geom_bar(position = "stack")##条形图 分类dplot + geom_bar(position = "fill")##等高条形图dplot + geom_bar(position = "dodge...

2017-04-27 19:20:00 2308

转载 ggplot2 ggplot()

p<-ggplot(diamonds,aes(carat, price))p + geom_point(colour="red")p + geom_point(aes(colour= color, shape= color))p + geom_histogram(stat="identity", binwidth = 500)p + geom_path()...

2017-04-27 16:36:00 171

转载 ggplot2:basic complete example

Data:diamondslibrary(ggplot2)qplot(x, y = NULL, ..., data, facets = NULL, margins = FALSE, geom = "auto", xlim = c(NA, NA), ylim = c(NA, NA), log = "", main = NULL, xlab = deparse(s...

2017-04-27 15:44:00 115

转载 movie bookmark

阿飞正传--重庆森林--花样年华--堕落天使甜蜜蜜春光乍泄戏梦巴黎--已婚女人--女人就是女人--发条橙--蝙蝠侠 黑暗骑士他人の顔 (1966)The.Face.Of.Anotherone fine day 1996转载于:https://www.cnblogs.com/JoAnnal/p/6762599.html...

2017-04-25 16:03:00 184

转载 Fixed effects model

In statistics, a fixed effects model is a statistical model that represents the observed quantities in terms of explanatory variables that are treated as if the quantities were non-random. This i...

2017-04-19 17:57:00 750

转载 panel data 定义

Panel dataIn statistics and econometrics, the term panel data (or longitudinal data) refers to multi-dimensional data frequently involving measurements over time. Panel data contain observa...

2017-04-19 17:46:00 306

转载 方差分析、回归分析和多层回归分析(2)【 One-way ANOVA】

One-way analysis of varianceIn statistics, one-way analysis of variance (abbreviated one-way ANOVA) is a technique used to compare means of three or more samples (using the F distribution). Thi...

2017-04-19 17:45:00 707

转载 方差分析、回归分析和多层回归分析(1)

1、方差分析方差分析的定义:方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。SST=SSB+SSW+SSEClasses ...

2017-04-19 17:20:00 1995

转载 T-test

UsesAmong the most frequently used t-tests are:A one-sample location test of whether the mean of a population has a value specified in a null hypothesis.A two-sample location test of the ...

2017-04-19 17:17:00 409

转载 常用检查代码

class()##检查数据类型str()##检查所有内容的格式结构  转载于:https://www.cnblogs.com/JoAnnal/p/6725114.html

2017-04-17 21:53:00 223

转载 MplusAutomation包的使用 二

---恢复内容开始---1、提取总结表格showSummaryTable(summaryStats, keepCols=c("Title", "LL", "AIC", "BIC", "CFI"), sortBy="AIC")showSummaryTable(summaryStats, dropCols=c("InputInstructions", "Observations"...

2017-04-17 16:50:00 604

转载 书单记录

《别独自吃饭》,英文名是 don not eat alone极简中国史活着转载于:https://www.cnblogs.com/JoAnnal/p/6714754.html

2017-04-15 17:19:00 86

转载 R 语文组数据分析 step2

本代码包含:1、难度:通过率、鉴别指数2、区分度:高低分组、相关3、科伦巴赫信度#############################################################################################################################################不分...

2017-04-15 16:50:00 135

转载 R 语文组数据分析 step1

本代码包含:1、原始数据进行拆分(作文和普通题目分开分析)2、选项分析、得分分布3、清洗数据,去除缺失>5的被试4、ABCD作答转换为[0,full]5、缺失值替换################################################################################################...

2017-04-15 15:47:00 160

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除