自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 obsidian制作自己的主题一文入门

在css中,我们通过"--变量名"的方式来表示这个变量可以在其它地方当成变量来使用。使用的时候通过var()这个函数就行了。obsidian就是通过这种方式控制样式的。

2024-06-20 18:50:49 677

原创 R语言中的列表list

list的第一个值$a是一个向量,$b是一个字符串,$c是一个常量,$d是一个列表。和原子型向量不一样的是,列表的元素可以是各种类型的数据,甚至可以再试一个列表。像字符型向量,数值型向量,逻辑型向量这些,它们共有的一个特点是,向量里面的值。从这里看出[[]]会深入到更深一层的数据,而[]只是从list中取一个值。[[1]]代表列表的第一个元素,[1]代表第一个元素里面的第一个元素。如果list里面的值是有名字的,可以用$这个符号加名字来取值。[[4]][[1]]代表列表第四个值里面的第一个列表值。

2024-06-06 21:36:26 540

原创 R语言中取向量子集

在R中,想要给向量取子集,就是在向量的后面加上[]符号。通过在[]符号里填写数据来控制取向量的哪部分子集。

2024-06-06 09:35:44 494

原创 用lubridate操作时间和日期

乍看之下,日期和时间很简单,因为生活中很常用。但是细看下来,它可以很复杂。本文介绍lubridate包来操作时间,需要额外加载这个包。本文操作的数据表是nycflights13,也需要提起加载。之前我们用的tidyverse包,也会用到它的函数,所以一起加载。

2024-06-03 16:22:17 591

原创 用forcats操作因子(factor)

在R中,。这些变量是已知的、固定的一组值,比如男女,小学生、中学生、大学生等等。因为在以前,因子操作起来会比字符串更方便,所以基础的R会自动把字符串转为因子。这也导致了,数据集中出现了许多不必要的因子。但在tidyverse中没有这样的烦恼。forcats就是专门处理因子的一个库,但是它不是tidyverse的核心成员,我们需要额外加载。

2024-05-29 12:51:05 822

原创 用stringr操作字符串

stringr不属于tidyverse包中的一员,需要手动加载。用单引号或双引号标志出来的就是字符串,建议多用双引号。如果想用双引号,可以把双引号放在单引号里面。对于特殊符号用转义字符\比如想输出\,你得写“\”。想输出",你得写“"”。字符串长度用str_length函数结果会输出一个向量,代表每个元素的字符长度。结果"xy"。也可以连接一个向量,比如:要记住,str_c是向量化操作所以如果你进行下面的操作,你可以想一下结果:结果是:“|-a-|” “|-b-|” “|-c

2024-05-28 12:19:37 567

原创 用dplyr处理关系型数据

很多情况下,数据分析需要处理多个表。我们需要联合多个表来分析数据,回答问题。今天,我们来看一下如何用dplyr来操作多个表。如果你学过sql语言,那这一节对你来说会很熟悉。

2024-05-27 21:37:58 879

原创 用tidyr实现数据清理

代表年龄段014=0-14岁25-34=25-34岁我们能看到这个数据集的列更像是“值”,而不是变量。所以我们按照我们之前讲的,需要对这个数据集进行gather。

2024-05-22 15:20:39 611

原创 css清除浮动的三种方法

css

2024-05-05 16:49:36 182 2

原创 综合应用:用tidyverse做探索性数据分析

在有了一批数据之后,我们很难说出这些数据代表什么。这需要我们提出一些假设,并通过视觉化、总结、建模等方式来寻求这些问题的答案。这里有一些试探、摸索的成分,目的是加深我们对数据的理解,发现数据内部潜在的信息。不过在这个过程中,我们会比较关注变量之间的和。其中,最基础要了解的就是数据的分布。

2024-05-04 08:13:44 994 1

原创 dplyr包中的汇总函数n,mean,median等配合summarize和group_by

mean(x)取平均数median(x)取中位数min(x)最小数max(x)最大数quantile(x,0.25)四分位数(比数据中25%的要大,但比75%的要小)first(x)取向量x的第一个值last(x)取向量x的最后一个值nth(x,2)去向量的第2个值n() 不需要参数,返回组的大小10.n_distinct(x)返回向量x中有多少个独特的值count(x)是n()的增强版以上很多x都可以换成逻辑值比如说:count(x$某一列 > 10)

2024-04-30 09:48:39 296 1

原创 css实现美观的标题

经常有下面的样式:就是在某个div块里会有一个标题,标题有以下三部分组成:下面的代码,可以帮助达到这样的结果:代码解读:html部分html用了一个div作为大框架,两个span分别代表矩形色块和文字部分。

2024-04-29 19:48:40 317

原创 css移除表格table边框

通常情况下,HTML表格会自带默认的边框效果,有点丑。那怎么移除呢?

2024-04-29 19:20:19 442

原创 R语言中懒得重复中间变量?用管道%>%啊

在R语言中,有一件事很烦人。我们不得不给每个中间生成的数据集命名。对我来说起名字可太难了。为了演示用,我做的操作有点多余,但是我们看到了,在这个过程中,我需要想出不同的变量名(flightsDelay,flightsSimple)来承接中间数据集。为了避免反复起名字,我们就需要用管道%>%了。

2024-04-25 08:10:03 251 1

原创 git常用操作(一篇入门)

在这里我们看到了自己一个人操作版本库常用的操作。但是需要涉及到多人 合作的时候应该怎么办?下个文章见。

2024-04-24 19:42:11 887 1

原创 git的配置

下载完成git后第一步,就是设置用户名和邮箱。这里添加了–global 选项,代表这个设置是应用于全局的。你在电脑上做的操作,git都会使用这些信息。

2024-04-23 14:01:46 388 2

原创 用dplyr包整理数据

在拿到数据之后,我们需要做数据整理。比如:为了做到这个,我们可以用dplyr包来进行数据的转换。dplyr已经整合进tidyverse了,所以加载tidyverse就行。为了进行演示,我们用到nycflights13库中flights数据集。这个数据集方法2:任务4:筛选凌晨到8点的航班还有一种写法是用到between函数,between返回一个区间范围。注意:缺失值总是排在最后有些数据集有很多变量,这代表着有很多列。可以通过select来选择某些列。mutate会在数据集的最

2024-04-23 12:44:28 247

原创 javascript通过Math.random函数生成验证码

生成一个随机n位验证码。

2024-04-21 16:46:37 135 1

原创 javascript中Date对象获得当日日期

主要用到Date对象;

2024-04-21 16:24:53 215 1

原创 用tidyverse库中的ggplot生成箱线图

见前面的文章。用到的数据库:mpg。

2024-04-17 09:57:50 159 1

原创 用tidyverse库中ggplot函数绘制条形图

参考前面的文章。

2024-04-16 22:30:17 276

原创 用tidyverse库中ggplot函数绘制拟合曲线

在用ggplot绘制散点图的时候,会有overplotting的问题。所谓的overplotting,就是在数据可视化中,当图形中的数据点过多,导致数据点重叠,难以区分和解读的现象。为了解决这个问题,我们可以用geom_smooth来绘制拟合曲线,方便我们分析数据。我们用到的就是geom_smooth函数。

2024-04-08 20:51:49 339

原创 tidyverse库ggplot2生成散点图

要想使用ggplot2函数,先要安装和加载tidyverse库。

2024-04-08 20:16:40 368

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除