自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

tidyss

写点啥

  • 博客(50)
  • 资源 (1)
  • 收藏
  • 关注

原创 R语言broom包整洁化模型

文章目录载入包建模broom:整洁模型数据purrr包向量化函数与broom包结合broom是tidyverse系列包之一,可以帮助人们获得干净整洁的模型数据结果,有效改善了R语言建模的用户体验载入包library(tidyverse)#broom包需要另行载入library(broom)建模#使用mtcars数据集fit <- lm(mpg~disp,data = mtcars)fitCall:lm(formula = mpg ~ disp, data = mtcars

2020-07-27 15:16:50 3849

原创 R语言echarts4r包图表类型(下)

文章目录载入包饼图圆圈图玫瑰图朝阳图树形图树图河流图日历图仪表盘雷达图词云水球图本文包含echarts4r包中的饼图、圆圈图、玫瑰图、朝阳图、树形图、日历图、雷达图等载入包library(echarts4r)library(tidyverse)-- Attaching packages --------------------------------------- tidyverse 1.3.0 --√ ggplot2 3.3.1 √ purrr 0.3.4√ tibble

2020-07-18 11:53:53 1043

原创 R语言echarts4r包图表类型(中)

文章目录载入包K线图漏斗图桑基图热力图平行图载入包library(tidyverse)-- Attaching packages --------------------------------------- tidyverse 1.3.0 --√ ggplot2 3.3.1 √ purrr 0.3.4√ tibble 3.0.1 √ dplyr 1.0.0√ tidyr 1.1.0 √ stringr 1.4.0√ readr 1.3.1 √

2020-07-11 13:46:39 849

原创 R语言echarts4r包图表类型(上)

echarts4r包图标类型比较多,分为上中下展示。载入包首先载入相关包,tidyverse包可以与echarts4r包配合使用可以一起载入。echarts4r包可以直接从cran上安装,使用install.packages即可library(tidyverse)library(echarts4r)线形图与面积图mtcars %>% rownames_to_column() %>% e_charts(rowname) %>% e_lin.

2020-07-07 14:08:55 1911

原创 R语言echarts4r包:绘制优雅动态图

文章目录安装使用特性快速开始突然看到期待已久的echarts4r包0.32版上线cran了,值得写点内容,顺便温习下用法。echarts4是百度开源项目,是一款简单实用、图表优美的js动态图表可视化包。R语言中的echarts4移植包有许多,echarts4r应该是目前移植效果最全面的了。同样是用***htmlwidgets***包作为中介移植。作者github上还有阿里的G2项目移植,也是一个非常不错的可视化包安装install.packages("echarts4r")使用li

2020-06-29 06:05:19 6093 1

原创 R语言dplyr包数据集拼接合并

文章目录inner_joinleft_join、right_join、full_joinbind_rows、bind_colsR语言dplyr包常用拼接合并函数有inner_join()、left_join()、right_join()、full_join()以及bind_rows()、bind_cols()inner_joininner_join是内连接的方式,选用的是一对一的连接方式.这种方式拼接简单,但如果某个数据集存在缺失值,这时候inner_join函数不太适用。library(tidyv

2020-06-27 19:11:50 8021

原创 用lavaan包进行验证性因子分析

文章目录安装The model syntax示例:验证性因子分析(CFA)建立模型拟合模型fit统计拟合情况用lavaan包进行cfa分析总结cfa是验证性因子分析的缩写,常常用于检验问卷的效度.流行于经管社科类学科,常见的可以实现该功能的商业软件有IBM旗下SPSS软件的AMOS模块、Mplus、LISREL等.这些软件简单易用菜单化操作同时作为收费软件价格昂贵。通过R语言相关包同样可以实现功能,而且不必安装过100M的软件占用电脑内存。免费、开源、功能强大。也可以通过编程实现自己的想法提高科研效率。

2020-06-22 20:11:54 3220

原创 用forcats包处理因子变量

文章目录生成模拟数据载入forcats包fct_countfct_relevelfct_dropfct_uniquefct_revfct_lumpfct_otherfct_infreqfotcats是tidyverse系列用于处理因子变量的包。它补充了一组因子变量处理函数,较R语言相关函数更为丰富全面。采用统一格式,重要函数前缀均为fct_,以方便查找。比较常见的函数有:fct_countfct_relevelfct_dropfct_uniquefct_revfct_lumpfct_o

2020-06-15 06:42:32 1088

原创 ggplot2添加散点图文字标记

文章目录散点图添加文字标记作用geom_text()优化散点图文字标记散点图添加文字标记作用散点图通常用于两个或两个以上数值变量之间关系可视化。将x变量与y变量各值在直角坐标系上以点的形式展示两个变量之间大致关系。这里通过一张图来展示散点图添加文字标记的作用。#删除mtcars15和17行生成模拟数据data <- mtcars[-c(15,17),]head(data) mpg cyl disp hp drat wt qsec vs am

2020-06-12 15:49:22 28982 1

原创 esquisse包:无需编程绘制ggplot2图形

esquisse包可以用界面化操作方式绘制ggplot2图形。这个包用shiny与miniUI包写成小工具形式,通过Rstudio使用。安装install.packages("esquisse")使用esquisse::esquisser()也可以通过工具栏上的Addins找到esquisse包点击打开。数据读入打开的第一个界面为数据读入界面。这个界面可以选择需要分析的数据、对数据...

2020-04-09 11:23:33 1419

原创 R语言排序函数

文章目录@[toc]sortrankorderarrangeR语言常用排序函数有内置函数sort,rank,order,还有dplyr包内函数arrange。#生成虚拟数据data <- data.frame( score = c(1800,1500,2000,2500,2500,NA), row.names = c('杭州','成都','南京','上海','北京...

2020-03-22 09:33:41 5082 5

原创 R语言迭代求值

如果要求mtcars数据中mpg、disp、hp三个数值变量的平均值(mean),会有多种方法可以实现。head(mtcars) mpg cyl disp hp drat wt qsec vs am gear carbMazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 ...

2020-03-13 18:10:56 4542

原创 用lubridate包创建日期与时间

文章目录@[toc]简介当前日期与时间创建日期与时间make_datetime获取各成分时间间隔简介lubridate包用于处理日期和时间,与基础R相关时间函数相比,它更加容易、易读。当前日期与时间基础R通过Sys.Date()查看当前日期或者说系统日期,通过Sys.time()查看当前时间。lubridate包通过today()查看当前日期,通过now()查看当前时间。today()...

2020-03-08 14:28:11 463

原创 用stringr包进行字符串处理

字符串字符串长度字符串拼接字符串分割取字符串子集大小写转换去除空格字符串匹配字符串检测stringr提供一系列用于字符串处理的函数。它与stringi包有着微妙的关系,相当于简化版的stringi包。它名称非常有特点,以str_为前缀,以方便用户检索到包中的函数。这里只展示常用函数,其他函数在实际应用中可以即查即用字符串字符串用引号包括起来创建,也可以用c()...

2020-03-03 14:13:17 595

原创 用dplyr包进行数据处理

文章目录@[toc]加载包与数据filter选择个案arrange排序select选择变量rename变量重命名mutate创建新变量summarize汇总变量dplyr包是tidyverse系列用于数据处理的包,常用函数有:filter()选择个案arrange()排序select()选择变量rename()变量重命名mutate()创建新变量summarize()汇总变量...

2020-02-28 18:45:47 431

原创 tibble数据格式

tibble是tidyverse系列的核心包之一。用来改进R内置数据框存在的许多问题。比如使用传统的data.frame数据框,数据列多于输出面板的宽度时会多行显示,显得比较乱。再比如传统数据框存在一种情况就是容易把字符串取值当做因子看待。使用library(tidyverse)加载相关核心包。使用as_tibble()将数据框转换成tibble格式。#使用state.x77数据hea...

2020-02-23 09:26:43 2270

原创 tidyverse初探

文章目录@[toc]tidyverse简介安装体验管道函数tibble数据格式可视化tidyverse简介tidyverse是一系列数据处理与可视化包的集合,由Hadley Wickham推出。旨在建立同一规范性的R包,以应对R语言包多而繁杂难以选择与使用的情况。其核心包以及相关包包括:ggplot2可视化dplyr数据处理tibble数据格式规范readr数据导入string...

2020-02-21 11:18:46 2007

原创 R语言格式化输出函数

文章目录@[toc]sprintfsinkcatstrtrimstrwrap字符串格式化输出函数主要有以下函数:sprintfsinkcatstrtrimstrwapsprintf用%s替代字符串name <- 'max'sprintf('my name is %s',name)[1] "my name is max"用%d替代整数age <- 18...

2020-01-10 12:29:02 9765

原创 用R语言玩游戏?

文章目录Rcadefun从python转向R语言之后,一方面渐渐入门写了个R包满足个人数据分析需求,另一方面就是在github上找各种R包。最近在github上找到了一个可以玩游戏的Rcade包,对R语言娱乐性方面的吐槽声小了不少。Rcade作者在github上说永远不会CRAN上发布,需要用devtools安装。install.packages(“ devtools”)devtool...

2019-12-28 15:38:11 3301 1

原创 R语言向量下标

文章目录正整数下标负整数下标倒数位置选取元素下标赋值下标超界逻辑下标which函数、seq函数向量下标即元素在向量中的位置,在实践中我们可以利用下标(元素的位置)来找出自己想要的数。利用runif函数生成包含10个正整数的向量x。options(digits = 1)set.seed(1234)x <- runif(10,min = 1,max = 20)x [1] 3 13...

2019-12-19 18:01:52 8066

原创 R包开发的标准姿势

文章目录建立R包项目打开项目文件夹编写DESCRIPTION文件编写R函数编写文档建立数据数据文件描述devtools生成包试用完善发表一个R包本质上就是一系列函数的集合,通过调用R包的函数从而实现相应的功能。R包开发对R语言编程能力提升有极大帮助,更能方便理解他人编写的包,而不仅仅调参。R语言已经存在上万的开源包,总会有一个包满足需求。当一个真香的调参侠才可节省时间。以windows系...

2019-12-10 18:06:16 1281

原创 Rmarkdown中文PDF输出方案

文章目录TinyTeXrticlesRmarkdown文件编译为html格式时,支持对中文的显示。而编译为PDF格式时,如果文件内存在中文会出现各种各样的问题,比如LaTex的显示问题。目前最简单方便的解决方案就是TinyTeX包加上rticles包。TinyTeX包可以在生成文件时自动搜索安装缺失文件,使用rticles内CTeX模板用于生成中文PDF文件。TinyTeXTingTeX使...

2019-12-05 14:11:16 3350

原创 Rmarkdown表格输出与美化

文章目录@[toc]原始输出表格knitr包美化表格kableExtra包美化表格kable_styling()表格操作Rmarkdown表格除了用markdown语法手动输入以外,还包括通过R语言函数生成的各种表格类输出。如用summary()函数进行数据描述时候、使用lm()函数进行线性回归建模输出的系数。这些原始输出结果美观上有所不足,可以使用各种R语言包进行美化。如knitr包、pa...

2019-12-02 17:13:52 14015 2

原创 Rmarkdown代码参数设置

本文简述Rmarkdown的代码输入及常见参数结果。回复‘Rmarkdown代码参数设置’下载本节Rmd文件,用Rstudio打开文件,点击Knit即显示运行结果。行内代码用两个单撇号包围,如r独立代码Rstudio快捷键ctrl+alt+isum_x_y <- function(x,y) { z <- x+y return(z)}sum_x_y(1,1)参...

2019-11-30 14:08:51 8720 1

原创 markdown常用语法

文章目录@[toc]标题无序列表有序列表引用表格粗体和斜体分割线链接Rmarkdown中文本使用markdown语法输入。markdown语法让文本输入有序,排版美观。标题标题以#号开头,#后面需要加空格。1到6级标题依次添加相应#数量。如一级标题# 一级标题。无序列表无序列表以-开头,空格之后添加文本。示例如下:无序列表1无序列表2无序列表3有序列表有序列表以1.数字加...

2019-11-27 08:59:06 197

原创 Rmarkdown简介

内容目录[[TOC]]Rmarkdown可以将R代码嵌入到markdown格式文件中,动态生成研究报告。通过knitr、pandoc可以将同一份报告编译成各种格式(html、word、pdf),同时借助Rmarkdown一系列扩展包,可以制作书籍、静态网站、幻灯片等。组成部分Rmarkdown文件以.Rmd为扩展名。内容上包括三部分:yaml文件头,放在文件开头部分。用以规定标...

2019-11-26 07:40:30 8954

原创 R语言日期值函数

内容目录[[TOC]]R语言中日期值通常以字符串形式出现,并转化为以数值形式储存的日期变量。描述通过函数as.Date()执行这种转化。语法格式为as.Date(x,'input_format'),其中x是字符型数据,input_format则给出了用于读入日期的适当格式。日期格式:符号含义示例%d数字表示日期(0~31)01~31%a缩写的星期...

2019-11-22 08:44:08 2080

原创 R语言字符处理函数

文章目录@[toc]描述示例字符处理函数用于处理文本型数据。nchar()substr()grep()sub()strsplit()paste()toupper()tolower()描述函数描述nchar(x)计算x中字符数量substr(x,start,stop)提取或替换一个字符向量中的子串grep(pattern,x,ignor...

2019-11-21 21:12:32 374

原创 R语言实用函数

内容目录[[TOC]]介绍几个R语言中的实用函数。length()seq()rep()cut()pretty()cat()描述函数描述length(x)返回对象x的长度seq(from,to,by)生成序列rep(x,n)将x重复n次cut(x,n)连续变量离散化。选项ordered_result=TRUEpretty...

2019-11-20 20:04:33 3049

原创 R语言apply函数簇

内容目录[[TOC]]R语言中的apply函数簇可以不通过for循环方式,实现对象迭代处理。可以有效提高运行效率。包括:lapply、sapply、vapply、mapply、tapply、apply。lapplylapply接收一个向量和一个函数作为函数。lapply(list,FUN,…)示例:#x为列表x <- list(a=1:5,b=6:10,c=11:15)...

2019-11-19 23:50:33 541

原创 R语言常用控制流函数

文章目录@[toc]重复和循环for结构while结构条件执行if-else结构ifelse结构swith结构控制流对R语言来说并不常用。for循环在R语言中的运行速度一直为人诟病。采用向量化运算方法计算比之快几十倍。应当尽量避免使用for循环等控制流,以多采用向量化运算方法提高速度。但这不意味着彻底摒弃在R语言中使用控制流。某些情况,使用控制流是非常合适的(如爬虫,使用for循环可以防止...

2019-11-18 17:51:59 777

原创 R语言常用图形(2)

文章目录@[toc]散点图适用条件散点图散点图矩阵折线图示例相关图马赛克图本文涉及基础图形有散点图、折线图、相关图、马赛克图。散点图散点图用于描述两个连续变量间的关系。适用条件连续变量散点图函数:plot(x,y)其中,x和y为连续变量。plot(mtcars$mpg,mtcars$wt)散点图散点图矩阵通常使用car包scatterplotMatrix()函数创...

2019-11-17 23:40:09 499

原创 R语言常见图形(1)

文章目录@[toc]条形图适用条件分类饼图适用条件示例直方图适用条件示例核密度图适用条件示例箱线图适用条件分类小提琴图示例点图示例本文涉及的基础图形有条形图、饼图、直方图、核密度图、箱线图、点图。条形图条形图通过垂直或水平的条形展示类别变量的分布(频数)。函数barplot()调用格式:barplot(height)其中,height是一个向量或一个矩阵。适用条件分类变量...

2019-11-16 17:12:58 1944

原创 R语言基础图形综述

文章目录@[toc]图形创建与保存创建保存图形参数符号和线条颜色文本属性图形尺寸与边界尺寸标题、坐标轴、图例标题坐标轴参考线图例文本标注数学标注图形组合par()layout()R语言基础图形分为创建图形与添加图形内容。创建图形条形图饼图直方图核密度图箱线图点图散点图折线图相关图马赛克图添加图形内容图形参数:符号、线条、颜色、文本属性、图形尺寸与边界尺寸标题...

2019-11-15 22:42:31 969

原创 R语言线性回归综述

文章目录@[toc]线性回归简介变量类型适用条件分类用途R语言实现模型建构模型评估模型检验模型修正线性回归简介线性回归是利用最小二乘法对一个或多个自变量和因变量之间关系进行建模的一种回归分析。变量类型线性回归要求自变量与因变量皆是连续变量。适用条件线性趋势。自变量与因变量之间的惯性应当是线性的。通过散点图来判断。独立性。因变量y的取值相互独立,之间没有联系。在线性模型中,实际...

2019-11-14 16:40:46 1851

原创 R语言相关性分析

文章目录@[toc]Pearson相关系数(积差相关系数)适用条件Spearman等级相关系数适用条件Kendall's Tau相关系数适用条件偏相关适用条件R语言实现Pearson、Spearman、Kendall示例偏相关相关性显著性检验相关性可视化在这里插入图片描述相关性分析就是通过定量指标描述变量之间的强弱、直接或间接的联系。常见相关性指标Pearson相关系数(积差相关系数)...

2019-11-13 19:28:19 23711

原创 R语言卡方检验

文章目录@[toc]卡方检验简介样本量要求卡方分析用途R语言示例卡方检验Fisher精确检验Cochran-Mantel-Haenszel检验卡方检验简介卡方检验时以χ2χ^2χ2分布为基础的假设检验方法。它的原假设是:观察频数与期望频数没有差别。χ2χ^2χ2值表示观察值域理论值之间的偏离程度。根据χ2χ^2χ2分布及自由度获得原假设成立情况下当前统计量的概率P。如果p值很小,说明观察...

2019-11-12 14:02:55 4991

原创 R语言差异检验:单因素方差分析

文章目录@[toc]方差分析介绍适用条件分类R语言单因素方差分析示例数据集示例多重比较评估检验的假设条件t检验可以解决单样本、双样本时的均数比较。当要比较的组多于两个时,t检验方法就难以满足这种需求,此时就需要使用方差分析来进行参数检验。它比较的是组间差异。方差分析介绍方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,...

2019-11-11 09:48:52 8944

原创 R语言差异检验:非参数检验

文章目录@[toc]Mann-Whitney U检验适用条件R语言示例Wilcoxon配对秩和检验适用条件R语言示例Kruskal-Wallis检验适用条件R语言示例Friedman检验适用条件R语言示例非参数检验是在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态进行推断的方法。它利用数据的大小间的次序关系(秩Rank),而不是具体数值信息,得出推断结论。它是参数检验所需要的某些...

2019-11-10 09:50:36 11733

原创 R语言差异检验:t检验

文章目录@[toc]单样本t检验适用条件具体计算公式R语言示例独立样本t检验适用条件具体计算公式R语言示例配对样本t检验适用条件具体计算公式R语言示例t检验(student t检验)是应用t分布的特征,将t作为检验的统计量来进行统计推断方法。它对样本要求较小(例如n<30)。主要用途:样本均数与总体均数的差异比较两样本均数的差异比较分类:单样本t检验独立样本t检验配对样本t...

2019-11-09 12:10:41 11978

NLP自然语言处理停词库

停词库,包含一般性常用词。可用于R语言与python的自然语言处理中的词频、关键词分析。绘制词云效果也是比较不错的。

2020-03-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除