自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 R 字符串处理函数整理

字符串处理虽然不是R语言中最主要的功能,却也是必不可少的,数据清洗、可视化等的操作 都会用到。对于R语言本身的base包提供的字符串基础函数,随着时间的积累,已经变得很多 地方不一致,不规范的命名,不标准的参数定义,很难看一眼就上手使用。字符串处理在其他 语言中都是非常方便的事情,R语言在这方面确实落后了。stringr包就是为了解决这个问题, 让字符串处理变得简单易用,提供友好的字符串操作接口.常用的字符串的处理以str_开头来命名,方便更直观理解函数的定义。我们可以根据使用习惯 对函数进行分类:

2021-10-10 17:41:19 547

原创 R语言 for循环和while循环

R 语言中循环结构包括for和while结构。1.for结构for循环重复地执行一个语句,直到某个变量的值不再包含在序列seq中为止。语法为:for (var in seq) statement例:for (j in c('2021-01-31','2021-02-28','2021-03-31')) print(j)上面的操作是比较基础的, 实际使用中, 按不同条件取数时 也经常需要循环来执行。2.while结构while循环重复地执行一个语句,知道条件不为真为止。语法为:while

2021-09-10 18:45:33 3155

原创 RMarkdown 创建动态报告

当我们做完统计分析, 会需要与他人交流研究成果。 这意味着要把分析整理到某种报告里面。 有三种常见的创建报告场景: 第一种:创建一个包含代码和结果的报告,便于记住6个月前做过的事情。如果要重做之前的事情,从单个完整的文档做起比从多个相关的文档做起要更加容易。第二种: 为客户创建一份报告。你需要注意清晰性和吸引性,而且这份报告可能只需要创建一次。 第三种:为日常需求创建一份特定类型的报告。这种情况下,数据会有所变化, 但是分析过程和报告结构保持不变。这些动态报告可以用网页,word,PDF等格式保存.

2021-08-11 18:39:41 864

原创 R DT包 datatable()的使用

DT包的使用官网DT包中最常用的函数是 datatable()。下面内容是datatable()的相关使用。datatable(data, options = list(), class = "display", callback = JS("return table;"), rownames, colnames, container, caption = NULL, filter = c("none", "bottom", "top"), escape = TRUE, sty

2021-07-10 17:08:29 3544

原创 数据集的合并-merge(),cbind(),rbind()

向数据框添加列 merge()要横向合并两个数据框,使用merge()函数。在多数情况下,两个数据框是通过一个或多个共有变量进行联结的(即一种内联结,inner join )。total <- merge(dataframeA,dataframeB,by = "ID")将dataframeA和dataframeB按照ID进行了合并。total <- merge(dataframeA,dataframeB,by = c("ID","Country"))用cbind()进行横向合并如

2021-06-11 14:01:19 2001

原创 R plotly包函数的使用 plot_ly(),add_trace(),layout()

Plotly 是个交互式可视化的第三方库,官网提供了Python,R,Matlab,JavaScript,Excel的接口,因此我们可以很方便地在这些软件中调用Plotly,从而实现交互式的可视化绘图。以下是在R 中 plotly包提供的各项函数。plotly各项函数1.plot_ly()官网地址plot_ly(data = data.frame(), ..., type = NULL, color, colors = NULL, alpha = 1, symbol, symbols = NU

2021-06-11 14:00:58 6454 1

原创 将函数应用于数据对象 apply()

函数可以应用于一系列的数据对象上,包括标量,向量,矩阵,数组,数据框。将函数应用于数据对象a <- 5sqrt(a)b <- c(1.2,222,30.34)round(b)c <- matrix(runif(12),nrow = 3)log(c)mean(c)这里mean()求得是矩阵中12个元素的均值。如果需要求得是矩阵中每列每行的均值,可以用R中的apply()函数,可将一个任意函数“应用”到矩阵、数组、数据框的任何维度上。apply()函数的使用格式为:ap

2021-06-11 14:00:21 428

原创 R ggplot图例的调整

ggplot 图例布局影响图例展示的很多设置由主题系统(theme system)所控制。可以使用theme()函数来调整这些主题设定。图例的位置和对齐方式的调整被主题设定参数legend.position控制,它可以取值为right,left,top,bottom,none(无图例)。例如:p <- ggplot(data = data, mapping = aes(x = x, y = input_data,group = yy,color = yy)) + geom_line

2021-05-12 19:59:18 3436

原创 R 工作空间的管理

工作空间(workspace)工作空间就是当前R 的工作环境,它储存着用户所有储存的对象(向量,矩阵,函数,数据框,列表)。在一个R会话结束后,可以将当前的工作空间保存到一个镜像中,并在下次启动R时自动启动它。各种命令行可在R中交互地输入。使用上下键查看自己已输入命令的历史记录。这样我们可以选择历史的命令,重新执行。当前的工作目录(working directory) 是R 用来读取文件和保存结果的默认目录。可以使用getwd()来查看当前的工作目录。或使用setwd()设定当前的工作目录。我们需要读

2021-05-12 19:58:57 481

原创 创建数据集

数据结构矩阵矩阵是一个二维数组,只是每个元素都拥有相同的模式(数值型,字符型,逻辑型)。可通过函数matrix()创建矩阵。一般格式为mymatrix <- matrix(vector,nrow = number_of_rows,ncol = number_of_columns,byrow = logical_value,dimnames = list(char_vector_rownames,char_vector_colnames))其中vector包含了矩阵的元素,nrow和ncol用

2021-05-12 19:58:38 71

原创 【数据整理】spread,gather,separate 和unite

数据整理原则就是让数据变得更好用。数据整理是一个从数据框的统计结构(变量与观测)到形式结构(行与列)的映射。他只要遵循原则:1.每一列代表一个变量。2.每一行代表一个观测。整理数据对ggplot2至关重要,因为ggplot2的任务就是将变量映射到视觉属性上。spread 和 gather下面两个表格他们其实是相同的数据,只是形式不同。左侧是宽数据(Cartesian data,笛卡尔型数据),你要通过行与列的交叉点来找对应的值。右侧是长数据(indexed data,指标型数据),你要通过

2021-05-12 19:57:46 858

原创 sqldf包——使用SQL语句操作数据框

sqldf可以实现对R中加载的数据执行sql语言,借助的是虚拟的数据库,进行相关数据的查询操作。在下载并安装好sqldf包以后,可以通过sqldf()函数在数据库上使用SQL中的select 语句。1)read.csv.sql将一个文件读入R,然后用sql语句过滤它read.csv.sql(file, sql = "select * from file", header = TRUE, sep = ",",row.names, eol, skip, filter, nrows, field.typ

2021-05-12 19:56:40 790

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除