自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

转载 概率统计基础与其R语言实现-5

假设检验

2021-12-02 14:41:03 2453

原创 概率统计基础与其R语言实现—4

置信区间

2021-12-02 13:52:28 391

原创 概率统计基础及其R语言实现-3

三个抽样分布讲解,卡方分布、t分布、F分布

2021-12-02 01:19:53 1213

原创 SQL初学者实用基础三

2. 数据类型与模式学习目标2.0:了解我们如何表示数据库系统中表之间的关系;探索我们如何让建模SQL数据库中的数据;2.1 引言在上一篇文章中我们介绍了简单的SQL操作,并留下了一个问题,如果表中有好几个Alice该怎么办?我们在关系数据库中,给每个record一个独一无二的ID,叫做primary key。同样的我们可以指定某一列(field)为特定的数据类型。我们用以下代码来检查数据类型:这可以显示名称,数据类型,fields是否可以为NULL等信息,上面提过prima

2021-12-01 21:25:30 508

原创 概率统计基础及其R语言实现-2

典型的概率分布:泊松分布、二项分布、正态分布等

2021-12-01 21:22:44 1016

原创 概率统计基础及其R语言实现-1

概率论基础知识——随机变量

2021-12-01 17:29:41 1131

原创 SQL初学者实用基础二

1.3 使用基本查询要检索表中的所有信息,我们可以编写query。例如我们想要搜索med_data数据(此数据表在上一篇文章中创建)中的数据:我们一般不会返回整个数据库的内容,因为数据量非常大,会很消耗时间,我们通常会编写查询(queries)来返回我们感兴趣的数据子集。比如我们通过列名代替*来提取某一列:如果出现错误,我们可以使用UPDATE命令来更改现有数据。假如说我们发现Alice的血压输错了,她其实血压是155/67:如果没有WHERE语句,所有血压都会被改成155...

2021-10-08 22:36:23 93

原创 数据分析之R语言学习9

坐标系统我们的默认坐标是笛卡尔坐标系,xy轴独立以确定每个点点位置,其实还有其他的坐标系。1. coord_flip()切换x和y轴位置当你想要水平方向的箱型图,或者变量的名称很长很难在x轴上放下时,他(协调-翻转)很有用。ggplot(data = mpg,mapping = aes(x=class,y=hwy))+ geom_boxplot()显然这是个竖直方向的箱型图,并且x轴坐标很拥挤。ggplot(data = mpg,mapping = aes(x=c.

2021-10-08 21:20:23 980

原创 SQL初学者实用基础一

1. SQL和数据库简介本专栏主要介绍SQL关系数据库(relational database)的一些概念。学习目标:研究关系数据库系统的关键特性;探索SQL数据库的结构。1.1 准备工作:在jupyter notebook中安装调用SQLSQL读作see-qual,全名structured query language,用来创建、删减、增加、改变和检索储存在关系数据库系统里的相关数据。关系数据库用表(tables)储存数据,每个表储存的数据和表语义相关,比如customer表储

2021-10-08 21:15:49 147

原创 数据分析之R语言学习7

统计转换#统计转换library(tidyverse)view(diamonds) #我们这次使用的是关于钻石的数据#来画一个条形图ggplot(data = diamonds)+ geom_bar(mapping = aes(x=cut))我们发现x轴是我们自己设置的cut变量,y轴是计数,但计数本身不是个变量。bar charts,histograms,frequency polygons都会统计原始数据中的计数值。这就是统计stat,因为本身我们数据里是没有count这个数

2021-09-26 16:14:54 297

原创 R语言——画图/可视化练习

#图1ggplot(data = mpg,mapping = aes(x=displ,y=hwy))+ geom_point()+ geom_smooth()这里有个小注意点,图中的曲线其实在散点图的上面一层。ggplot(data = mpg,mapping = aes(x=displ,y=hwy))+ geom_point()+ geom_smooth(mapping = aes(class=drv))这个图上层次更加明显,如果我们想把曲线图放到底层去:..

2021-09-24 22:42:49 500

原创 数据分析之R语言学习6

观察下面两幅图:这两幅来自:#上ggplot(data = mpg)+ geom_point(mapping = aes(x=displ,y=hwy))#下ggplot(data = mpg)+ geom_smooth(mapping = aes(x=displ,y=hwy))我们会发现这俩图x y轴都相同,描述的是同一组数据,只是图像类型不同,在R语言中我们叫做geoms不同。不同的geom类型描述不同的图像比如说上面的geom_point绘制散点图,geom_sm..

2021-09-24 22:14:04 162

原创 数据分析之R语言学习5

承接前文内容,如果我们分别作出每一种class的displ-hwy散点图,我们可以利用facet,按照class变量分类:ggplot(data = mpg)+ geom_point(mapping = aes(x=displ,y=hwy))+ facet_wrap(~class,nrow = 2)得到图像:当我们按气缸cyl分类:ggplot(data = mpg)+ geom_point(mapping = aes(x=displ,y=hwy))+ facet_g

2021-09-24 20:23:09 299

原创 数据分析之R语言学习4

4.3 ggplot2绘图ggplot2是目前R语言最通用的绘图系统,它也在tidyverse里,我们需要先加载这个包:library(tidyverse)加载完成后它会告诉你这个包有哪些功能,并且会和哪些功能冲突。如果你运行之后告诉你没有这个包,你需要先下载它:install.packages("tidyverse")我们来分析汽车数据(美国环保局收集的38种车型的相关数据)先总览一下这组数据,有11列,如果我们想要研究发动机大小(displ)与汽车燃油效率(hw..

2021-09-24 19:43:30 93

原创 数据分析之R语言学习3

四、循环语句4.1 引言循环语句说白了就是用来减少重复的语句。R语言中一般有以下几种循环方式:4.1.1 for循环我们有一个简单的tibble数据框(tibble()集成在tidyverse包里),并且想要分别得到这些列的平均数,第一反应是一个个去计算,当然我们可以得到结果,就是比较麻烦:library(tidyverse)df <- tibble( a = rnorm(15), b = rnorm(15), d = rnorm(15), e = rnorm

2021-09-24 15:40:41 142

原创 数据分析之R语言学习2

三、导入/输出数据3.1工作目录(work directory=wd)R语言可以读取本地数据。我们需要将数据放在工作目录下面。可以通过setwd()设置工作目录,通过getwd()知道工作目录是哪个:#设置工作目录,我把它设置为桌面的R文件夹里的1文件setwd("Desktop/R/1")getwd()下载数据集到这个工作目录下,然后可以用read.csv("文件名.csv")来读取csv数据,非常简单。read.csv("文件名.csv")同样的,将数据写到文件里..

2021-09-23 20:57:29 356

原创 数据分析之R语言基础学习一

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2021-09-23 19:19:15 1346

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除