![](https://img-blog.csdnimg.cn/20190919104327667.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
R-数据科学
obwte
善假于物
展开
-
ggplot扩展包--gghalves
gghalves包描述这里主要介绍这个包中的geom_half_violin()函数,它相当于geom_violin()函数的变体,因为这个函数主要作用就是展示一半的小提琴图,然后与其他图形组合。实用geom_half_violin(mapping = NULL, data = NULL, stat = "half_ydensity", position = "dodge", ..., side = "l", nudge = 0, draw_quantiles = NULL, trim =原创 2020-07-22 14:21:47 · 2379 阅读 · 0 评论 -
R-数据科学(九):函数与控制
自定义函数语法:myfunction <- function(arg1, arg2, ... ){ statements return(object) }参数解释:参数解释myfunction自定义函数名称arg1, arg2, ...自定义参数arg1,arg2…statements语句return()返回输出结果示...原创 2019-10-29 15:35:54 · 575 阅读 · 0 评论 -
R-数据科学(八):矩阵
本文中关于矩阵的内容仅限于R中数据结构,并不涉及线性代数里面的概念。在R的数据结构中,矩阵就是折叠的向量,所以对于数值型向量的运算也可以用在矩阵上。矩阵的本质在介绍矩阵的运算前,我们得明白一个概念循环补齐,这对我们认识矩阵的本质有很大帮助,所谓循环补齐,就是当长度呈倍数关系的两个向量进行运算时,R会自动按照较长的向量的长度,将较短的向量重复,直到和较长的向量等长。循环补齐示例:vec...原创 2019-10-28 20:29:59 · 374 阅读 · 0 评论 -
R-数据科学(七):字符串处理与正则表达式
文章目录1 字符串基础2 正则表达式实现模式匹配2.1 基础匹配2.2 锚点2.3 字符类和字符选项2.4 重复2.5 分组与回溯引用3 工具3.1 匹配检测3.2 提取匹配内容3.3 替换匹配内容3.4 定位3.5 其他操作4 正则表达式总结参考资料之前在向量中已经介绍了字符型向量的操作,但是由于基础函数使用方法不一致,一段时间不用就容易会忘记,那么有没有一个包既可以包含这些基础函数,并且操作...原创 2019-10-28 14:24:22 · 835 阅读 · 0 评论 -
R-数据科学(六):数据框-表格重塑
R语言中数据框的操作除了单表操作、双表操作以外,还有一个非常重要的操作是表格重塑,它的作用更为实际,因为在我们处理真实数据的时候,往往需要通过重塑表格来对收集到的数据集进行一个预处理。数据集的预处理主要分为两类:整体预处理:长型数据集变为宽型数据集,或者宽型数据集变为长型数据集。列预处理:一列中每个单元格分为多列,一列中的每个单元格分为多行,合并多个列中的单元格以形成单列。在R中可以使...原创 2019-10-27 15:12:01 · 642 阅读 · 0 评论 -
R-数据科学(五):数据框-双表操作
文章目录1 rbind()、cbind()函数合并数据集2 dplyr包组合数据集2.1 按行组合2.2 按列组合在我们分析数据过程中,不仅仅是处理一个数据集,也会组合两个数据集,这时候就可以用dplyr包进行相关的操作,当然这些操作也可以分为两大类:按行组合和按列组合。在使用dplyr包之前,我想先介绍R中两个基础函数rbind()函数和cbind函数。这两个函数只能满足简单的需求,主要是...原创 2019-10-23 20:53:00 · 553 阅读 · 0 评论 -
R-数据科学(四):数据框-单表操作
通常我们将EXCLE表格或者分隔符分割的文本文件导入R中进行处理,这些数据在R语言称为数据框也可以叫做数据集,数据框中的行、列也分别称为观测和变量。应用于数据框的函数和R包有很多,目前对数据框处理速度比较快的两个R包是鼎鼎大名的dplyr包和tidyr包,这两个包最主要的三个作用分别是:单个数据框的操作两个数据框的操作数据框的重塑接下来我将通过三篇文章分别介绍这三类操作、首先介绍的是...原创 2019-10-22 20:25:27 · 2167 阅读 · 0 评论 -
R-数据科学(三):向量
之前我在R-基础(一):数据结构中初步介绍了向量的定义和类型以及对于向量的简单操作,如向量中的元素选取等,但是还有许多常用且相对复杂的操作并未提及,这篇文章的目就是详细的介绍我在学习过程中遇到的所有关于向量的操作。1 向量的创建创建空向量c()## NULL创建字符型向量color = c('blue','yellow','red')names(color) = c('col1','...原创 2019-10-22 09:32:09 · 450 阅读 · 0 评论 -
R-数据科学(二):目录和文件
R语言可以对目录和文件进行一些简单的操作,比如常见的增删改查,文件的读取,文件的写入,对文件进行解压等。1 目录和文件增删改查函数作用操作对象getwd()查看当前工作目录目录setwd()设置当前工作目录目录dir.create()创建目录目录list.dir()列出目录下所有内容目录unlink(“tmp”,recursive=...原创 2019-10-17 10:20:55 · 632 阅读 · 0 评论 -
R-数据科学(一):数据结构
R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表。它们在存储数据的类型、创建方式、结构复杂度,以及用于定位和访问其中个别元素的标记等方面均有所不同。下图是一张R语言数据结构图。向量定义:用于存储数值型、字符型或逻辑型数据的一维数组。向量中的元素类型必须全为数值型或者字符型或者逻辑型。向量中的单个元素称为标量,属于特殊的向量。向量是R语言中最基础,也是最重要的...原创 2019-10-16 20:37:39 · 1056 阅读 · 0 评论