![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 60
小Li先生
The only way to do great work is to love what you do.
展开
-
R语言—方差分析之批量处理
R语言-方差分析之批量处理转载 2022-09-15 10:16:52 · 2629 阅读 · 6 评论 -
R语言—方差分析和多重比较
R语言方差分析和多重比较转载 2022-09-14 17:31:28 · 920 阅读 · 0 评论 -
循环计算逻辑回归模型
统计计算模型的P值或者截距等变量是常有的事情,一般在变量不多的情况下,多数一个一个的手动计算,但不免有时原始数据的改动,导致一系列的变动,很不好受。这时R语言的作用就很明显,只需要run一下,就可以重新处理一遍数据。同时R语言中的for循环或者apply族循环,也是解放双手的一大利器。今天举个小栗子,说说循环这件事。for循环1 数据格式2 建立`formula`连接3 建立空数据集4 `for`循环5 合并及导出数据1 数据格式136行27列,27个变量,第一个变量与其余26个变量都需要建原创 2021-11-02 21:25:42 · 708 阅读 · 2 评论 -
R语言常用函数
目录1. 数学函数2. 统计函数3. 概率函数4.字符处理函数1. 数学函数函数作用abs()绝对值sqrt()平方根ceiling()不小于x的最小整数floor()不大于x的最大整数round(x,digits=n)将x舍入为指定位的小数signif(x,digits=n)将x舍入为指定的有效数字位数2. 统计函数函数作用mean()平均值median()中位数sd()标准差sum()转载 2021-09-17 15:37:43 · 1101 阅读 · 0 评论 -
R语言数据统计2——T(t)检验
t检验算法及其在R语言中的实现常用统计方法-1:t检验,秩和检验和方差分析1 定义t 检验法就是在假设检验时利用 t 分布进行概率计算的检验方法。那问题来了,什么是 t 分布呢?自行百度吧所以我们在进行 t 检验之前,应该对数据进行正态性检验以及方差齐性检验2 单样本T检验1)提出假设:-2) 计算t3)统计推断4)在R中实现单样本T检验> data <- c(4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4原创 2021-09-08 23:02:16 · 8097 阅读 · 0 评论 -
R语言数据统计1——正态性检验
正态性检验之qqplot和ppplot原理及R语言实现 KS检验和SW检验的区别t检验算法及其在R语言中的实现R语言与统计分析我们注意到这组数据仅30行,是一个小样本数据,如果数据量在3-50之间,我们倾向于看S-W检验的结果设置参数var.equal=TURE,指定样本之间是等方差的,也可以通过alternative=这个参数来指定单侧检验...原创 2021-09-07 22:13:21 · 25999 阅读 · 2 评论 -
R语言缺失值判断与处理mice包-3
用R语言填充缺失值mice1.缺失值填充方法删除平均值、中位数回归插值多元回归插值2.mice包介绍对于缺失值数据的处理,用3个步骤来进行定义。填充:mice()函数,从一个包含缺失数据的数据框开始,然后返回一个包含多个完整数 据集的对象,每个完整数据集都是通过对原始数据框中的缺失数据进行插而生成的。分析:with()函数,可依次对每个完整数据集应用统计模型,分析填充的结果。优化:pool()函数,将这些单独的分析结果整合为一组结果,最终模型的标准误和p值,都将准确地转载 2021-09-06 22:04:03 · 7808 阅读 · 20 评论 -
R语言缺失值判断与处理-2
R语言-缺失值判断以及处理上次说了关于某个固定值,异常值,缺失值等的固定位置,今天详细说下如果数据列中出现缺失值,该如何处理。向量组中的不说了,一般实践都是数据框。1.数据框缺失值判断数据框类型判断缺失值is.na、缺失值的填补which、缺失值所在行的删除na.omit1.数据列2.判断is.na()3.对应行列位置which(arr.ind = T)4.删除na.omit5.统计缺失值数量sum,mean,table6.计算忽略(平均值,求和,sd,se等等)na.rm=TRUE转载 2021-09-05 18:29:40 · 1468 阅读 · 0 评论 -
R语言查找指定值的位置(行列)1
坚持写东西真的不容易,已经停更好久了,哎!用R查找数据是常有的事情,例如:我想知道A列的空值(NA)或者0或者异常值在哪一行,当然1000行内的扫一眼就好,如果上万行的怎么办呢?目录1. 数据列介绍2. 问题及解决办法查找空值位置3. 延伸1. 数据列介绍我这里有个5W+行24列的数据列> dim(ms_data3)[1] 509823 24> str(ms_data3)'data.frame': 509823 obs. of 24 variables: $ X原创 2021-09-03 15:47:46 · 11083 阅读 · 3 评论 -
如何提取多元回归lm里面的全模型的R2和p值
回归模型提取R2和p值all_ck <- function(formula,i){ lm_data <- lm(formula,data=list[[i]]) summar <- summary(lm_data) b <- summar$coefficients[1,1] k <- summar$coefficients[2,1] R2 <- summar$r.squared # tstats <- coef(lm_data) / sqrt原创 2021-07-21 17:10:33 · 4464 阅读 · 1 评论 -
Fibonacci 斐波那契数列的R语言实现
非递归的算法Fibonacci <- function(n){ f <- c() f[1] <- 1 f[2] <- 1 if(n == 1|n == 2) { f[n] <- f[n] return(f) } else { for(i in 3:n) { f[i] <- f[i-1] + f[i-2] } return(f) }}> Fibonacci(39)原创 2021-07-12 16:17:20 · 4072 阅读 · 0 评论 -
R语言-词云(个性化绘制)
个性化词云原创 2021-05-29 22:13:46 · 1543 阅读 · 0 评论 -
数据处理小技巧——R语言默认颜色
默认颜色library(scales)show_col(hue_pal()(n)) #n为1~6原创 2021-05-27 23:21:58 · 1907 阅读 · 0 评论 -
R语言dplyr包中的filter函数
R语言日常笔记(1)filter函数经常忽略的两个用法1.单列多因素挑选city列为武汉市和month列为1:5或9:12(观测值)> ms_wh <- filter(ms_data2,city=="武汉市"&month %in% c(1:5,9:12))> head(ms_wh) station year month day precipitation meanTem sunshine minTem maxTem site province city1原创 2021-05-27 23:17:13 · 4844 阅读 · 0 评论 -
R语言ggplot2 柱状图(条形图)xy轴翻转,及排序
ggplot(data = rate,aes(x=reorder(地区,地区生产总值.)))+ geom_bar(aes(y=地区生产总值.,fill=地区),stat = "identity")+ labs(title = "2015年山东各地市生产总值及占比情况")+ geom_text(aes(label=rate$地区生产总值.,y=地区生产总值.-500))+ geom_text(aes(label=b,y=地区生产总值.+600))+ coord_flip()+ xla.原创 2021-04-26 16:43:51 · 17057 阅读 · 7 评论 -
正态分布函数概率运算dnorm/pnrom/qnrom/rnorm
R语言开发之正态分布了解下生物统计(7)——R中dnorm, pnorm, qnorm与rnorm的区别原创 2021-04-07 15:55:58 · 4118 阅读 · 0 评论 -
R语言循环语句while和repeat
R语言循环语句1、for语句2、while循环语句3、repeat语句4、举例5、引用1、for语句R语言批量处理1——输出list文件及数据框长宽转换R语言批量处理2——导入excel,定位提取合并为数据框data.frame2、while循环语句注意执行顺序,先执行f[i]+f[i+1]<1000,然后往下走,与下面repeat有区别例子 计算斐波那契数列> f=1> f[2]=1> i=1> while(f[i]+f[i+1]<1000)原创 2021-04-06 17:51:48 · 2453 阅读 · 0 评论 -
R语言随机抽样及分层抽样
R语言随机抽样及分层抽样问题1、计算层次个数2、固定随机提取3、随机抽样问题> dim(ml_data)[1] 201253 11场景:20万行数据中,抽取每个月中的任意一天的数据,即,2019-9-6/2019-9-7/2019-9-8…1、计算层次个数dplyr包中count函数计算出每天的数据量,然后dim查看数据列346行,346个层次,346天。> bb <- count(ml_data,date)> > head(bb)原创 2021-04-05 16:29:49 · 8609 阅读 · 5 评论 -
R语言数据去重
R语言数据列去重1、unique函数2、duplicated函数3、distinct(dplyr包)4 引用unique对于一个向量管用,对于matrix、data frame那些指定列去重就不管用了1、unique函数查看重复的方式,有点像分类变量个数一样,unique() 或者 table() 都是很好的方式去检测。> c a b d1 1 a 12 2 b 13 3 c 14 1 a 15 2 b 16 3 c 1> unique(c) a b d原创 2021-03-25 16:35:18 · 14108 阅读 · 0 评论 -
R语言常用快捷键1
快捷键1赋值符号(<- )2管道符( %>%)1赋值符号(<- )Alt+—2管道符( %>%)Ctrl+Shift+M原创 2021-03-19 14:43:48 · 11569 阅读 · 0 评论 -
R语言日常报错1
常见函数报错1.count函数报错1.count函数报错使用dplyr包中的count函数报错:> hh.site2<- count(hh.site1,hh.site1$市) %>% arrange(n);hh.site2 ## 试验点试验时间(几年?)[1] Error in FUN(X[[i]], ...) : 找不到对象'宝鸡市'解决办法添加dplyr::count> hh.site2<- dplyr::count(hh.site1,hh.site原创 2021-03-18 17:03:58 · 949 阅读 · 2 评论 -
R语言数据相关性分析(相关系数和p值)及可视化
此篇为转载R语言学习笔记之相关性矩阵分析及其可视化数据相关性分析及可视化1. 新建数据集2. Hmisc3. 可视化相关系数矩阵4. chart.Correlation()来自于包PerformanceAnalytics5. 此篇为笔记转载如有侵权联系删除1. 新建数据集data(mtcars)#加载数据集mydata <- mtcars[, c(1,3,4,5,6,7)]head(mydata, 6)#查看数据前6行2. Hmisc包里的rcorr()函数能够同时给出相关系数以及转载 2021-03-07 21:48:32 · 79309 阅读 · 21 评论