自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

我要养只哈士奇的博客

10年后的数据科学家工厂

  • 博客(21)
  • 收藏
  • 关注

原创 细思极恐——R语言forestplot包画meta分析群体药动学常用森林图

细思极恐——R语言forestplot包画meta分析群体药动学常用森林图 今天,笔者想分享一下最近科研作图的经历,最主要的就是用于群体药动学模型建立的森林图,其百度百科定义为: 森林图是以统计指标和统计分析方法为基础,用数值运算结果绘制出的图型。它在平面直角坐标系中,以一条垂直的无效线(横坐标刻度为1或0)为中心,用平行于横轴的多条线段描述了每个被纳入研究的效应量和可信区间(confidence...

2018-12-06 11:46:49 15023 4

原创 R深度学习——文本分类问题

R深度学习——文本分类问题 这一节用一个实例介绍怎么对文本信息进行二项分类,使用的是IMDB数据集,将其中对电影的评价进行正面和负面的分类: library(keras) library(dplyr) library(ggplot2) library(purrr) 下载数据集: imdb <- dataset_imdb(num_words = 10000) c(train_data, t...

2018-12-01 16:17:22 756

原创 R深度学习——基本分类问题

R深度学习——基本分类问题 这里使用Keras框架对Fashion MNIST数据集进行分类: library(keras) 划分训练集测试集: fashion_mnist <- dataset_fashion_mnist() c(train_images, train_labels) %<-% fashion_mnist$train c(test_images, test_la...

2018-11-30 17:50:11 848

原创 R for Data Science总结之——Dates and times

R for Data Science总结之——Dates and times 本章介绍lubridate包,可以方便处理日期相关数据分析工作: library(tidyverse) library(lubridate) library(nycflights13) 在R中有三种日期时间相关的数据类型: date time date-time 对于times,可使用hms包 today() #...

2018-11-29 16:37:55 628

原创 R for Data Science总结之——Factors

R for Data Science总结之——Factors factor类型在R中用于处理分类变量,这里我们使用forcats包,也就是for categorical variables: library(tidyverse) library(forcats) 定义factor: x1 <- c("Dec", "Apr", "Jan", "Mar

2018-11-28 16:50:31 1352

原创 R深度学习——Keras入门

R深度学习——Keras入门 在人工智能时代到来之际,最成熟的AI框架莫过于Tensorflow,但其构建是基于Python的,但我们作为熟练R语言的数据科学家,也想使用Tensorflow,这一梦想Rstudio已经帮我们实现,这里将介绍如何在R中装配和运行Tensorflow的上层Keras框架: install.packages("keras") 首先安装keras包,默认将Tensorf...

2018-11-26 16:26:50 3481 3

原创 R for Data Science总结之——Strings

R for Data Science之——Strings 这一章关注R中字符串和正则表达式的处理: library(tidyverse) library(stringr) 在R中,字符串是用""或’'括起来表示的: string1 <- "This is a string" string2 &am

2018-11-24 15:41:50 441

原创 R for Data Science总结之——Vectors

R for Data Science之——Vectors 对于整个tidyverse框架而言,最重要的莫过于其数据结构tibble,而tibble得基础,也就是vector,向量。 library(tidyverse) vector包括两类: Atomic vectors:logical, numeric(integer, double), character, complex, raw li...

2018-11-22 11:35:11 1697 1

原创 生物等效性试验样本量,效能,置信区间计算神器之R包——PowerTOST

首先,笔者自己是个略懂编程的药学院学生,由于本科专业的原因在java, python的领域混迹了很久,终于硕士期间接触了Data Science步入了anaconda, R的大门,尝试用这些工具解决一些医药领域的问题,这里就要介绍最近发现的一个新工具:PowerTOST包用于生物等效性试验模拟仿真。 PowerTOST前世今生 首先是安装: install.packages("Power...

2018-11-22 10:33:08 9266 1

原创 R for Data Science总结之——Iteration

R for Data Science之——Iteration 不想多说了,直接上代码 library(tidyverse) df <- tibble( a = rnorm(10), b = rnorm(10), c = rnorm(10), d = rnorm(10) ) median(df$a) #> [1] -0.246 median(df$b) #> [1]...

2018-11-21 18:56:06 622

原创 R for Data Science总结之——Relational data

R for Data Science之——Relational data 很多时候我们处理的不是单一数据集而是互相关联的相关数据集,他们之间以主键外键等想连接,我们需要将他们整合成一个完整数据集进行分析: library(tidyverse) library(nycflights13) airlines #> # A tibble: 16 x 2 #> carrier name ...

2018-10-13 09:45:59 1001

原创 R for Data Science总结之——Tidy Data

R for Data Science总结之——Tidy Data 在R中进行数据挖掘要求数据集具有tidy data的特征,这有点类似数据库中的范式结构: 每一个变量都有自己独立的一列 每一个观测值都有自己独立的一行 每一个数据都是独立的单元格 这里我们会用到tidyr包来处理每一个数据集使其拥有tidy data的特征,其包含在tidyverse框架中: library(tidyverse...

2018-10-08 15:56:03 3269

原创 R for Data Science总结之——readr

R for Data Science总结之——readr readr包顾名思义就是将数据导入R环境的方法,我们这里直接使用tidyverse框架,其中包含了readr包: library(tidyverse) 主要方法有: 分隔符读入:read_csv(), read_csv2(), read_tsv(), read_delim() 空格分隔读入:read_fwf(), read_table(...

2018-10-07 11:25:12 4646

原创 R for Data Science总结之——Parse functions

R for Data Science总结之——Parse functions 就数据类型转换而言,R内置的as.factor()等系列方法已经可用,但tidyverse框架中给了另一套parse函数,较老函数而言更整洁,更明确 ...

2018-10-07 11:01:44 2262

原创 R for Data Science总结之——tibble

R中传统的data.frame是很老的数据结构,而在新的tidyverse框架中提出了新的tibble来替代一些老的行为模式: library(tidyverse) 将老式数据框转换成tibble: as_tibble(iris) #> # A tibble: 150 x 5 #> Sepal.Length Sepal.Width Petal.Length Petal.Width...

2018-10-05 15:06:28 9742

原创 R for Data Science总结之——modelr(3)

R for Data Science总结之——modelr(3) 这一章中我们将对大型数据集进行分组建模,深入挖掘数据集特征: library(modelr) library(tidyverse) library(gapminder) gapminder #> # A tibble: 1,704 x 6 #> country continent year lifeExp ...

2018-10-04 10:26:08 775

原创 R for Data Science总结之——modelr(2)

R for Data Science总结之——modelr(2) 本章针对真实数据集进行建模实践: library(tidyverse) library(modelr) options(na.action = na.warn) library(nycflights13) library(lubridate) 为什么低质量的钻石更加昂贵? 首先查看diamonds数据集: ggplot(diam...

2018-10-02 17:14:10 877

原创 R for Data Science总结之——modelr(1)

R for Data Science总结之——modelr(1) 数学模型是用来提供一个数据集的低维总结性描述,通常而言,R语言内置的线性模型lm()函数已经可以用来描绘绝大多数数学模型,这一章简要介绍数学模型机理和其作用。 library(tidyverse) library(modelr) options(na.action = na.warn) 最简单的例子 ggplot(sim1, a...

2018-10-02 11:26:38 2504

原创 R for Data Science总结之——探索性数据分析

R for Data Science总结之——探索性数据分析 通常来说,探索性数据分析分为以下三步: 对数据集提出问题 通过数据可视化,数据处理以及数据建模寻找答案 解决问题或提出新的问题 首先载入包: install.packages("tidyverse") 查看数据: ggplot(data = diamonds) + geom_bar(mapping = aes(x = cut)...

2018-09-27 11:00:30 844

原创 R for Data Science总结之——dplyr

R for Data Science总结之——dplyr dplyr是R语言中一个非常流行地应用于数据处理的包,其功能包含普通SQL语言的增删改查以及统筹计算等,本文测试数据集用的是nycflights13::flights, 加载代码为: library(dplyr) library(nycflights13) 这里也建议直接使用Hadley Wickham的一套数据处理包tidyverse,...

2018-09-22 10:49:16 2206

原创 R for Data Science总结之——ggplot2

R for Data Science总结之——ggplot2欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchar...

2018-09-21 11:31:00 860

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除