自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

HuFeiHu

知无涯者,虚心若愚,求知若饥,勇者天佑 !

  • 博客(537)
  • 资源 (1)
  • 收藏
  • 关注

转载 R语言中文社区历史文章整理(作者篇)

本文选取在R语言中文社区发文较多、较系统的作者整理而成,作者排名不分先后。陈丹奕:知乎大神丹奕论道数据分析师自我修养之天龙八步建模那点事儿——实战篇7个步骤,带你从零开始制作一份简单的数据报告陈老师:日报没人看,周报全白干!减少无效报表就该这么干!码数5小时,结论憋两天,分析报告结论到底该怎么下!从一个小问题洞察挣钱秘籍,却被90%的数据分析师忽略数据化甩锅!把问题优雅的甩给外部环境,活学活用PE...

2018-03-30 10:19:40 989

转载 R resources (free courses, books, tutorials, & cheat sheets)

Date: 10 August 2017Author: Paul van der Laken14 CommentsBelow is a list of free books, tutorials, packages, cheat sheets and other material to learn programming in R and improve your workflow. There ...

2018-03-30 10:10:37 1200

原创 Ubuntu安装Rstudio

1、如果用版本控制系统,则先安装gitsudo apt-get install git2、添加用户和设置密码useradd hufeihu -m -s /bin/bashsudo passwd hufeihusu hufeihu mv rstudio-server-1.1.442-amd64.deb /home/hufeihu/dpkg -i rstudio-server-1.1.442-amd6...

2018-03-28 16:15:01 969

原创 Ubuntu 上R包安装问题汇总

Linux 上安装R包出错后一般会有以下的提示1、Ubuntu R 安装rgdal 出错apt-get install gdal-binapt-get install libxml2 apt-get install libxml2-dev apt-get install libgdal1-dev sudo apt-get install libgdal1-dev libproj-dev2、Ubun...

2018-03-28 15:54:26 3759

转载 dplyr包介绍学习

dplyr包:plyr包的替代者,专门面对数据框,将ddplyr转变为更易用的接口%>%来自dplyr包的管道函数,其作用是将前一步的结果直接传参给下一步的函数,从而省略了中间的赋值步骤,可以大量减少内存中的对象,节省内存,可惜的是应用范围还不是很广。dplyr和data.table(易于操作数据)是R的两个高效数据处理包,这两个包有它们各自的优点。data.table在语法灵活性和perf...

2018-03-27 11:37:22 6131

转载 ggplot2包介绍学习

分析数据要做的第一件事情,就是观察它。对于每个变量,哪些值是最常见的?值域是大是小?是否有异常观测?ggplot2图形之基本语法:ggplot2的核心理念是将绘图与数据分离,数据相关的绘图与数据无关的绘图分离ggplot2是按图层作图ggplot2保有命令式作图的调整函数,使其更具灵活性ggplot2将常见的统计变换融入到了绘图中。ggplot的绘图有以下几个特点:第一,有明确的起始(以ggplo...

2018-03-27 11:35:20 2555

原创 Ubuntu 安装Docker

(1)到清华大学开源镜像站下载deb包https://mirrors.tuna.tsinghua.edu.cn/docker-ce/linux/ubuntu/dists/xenial/pool/stable/amd64/(2)安装依赖apt-get install apt-transport-https ca-certificates curl gnupg2 software-properties...

2018-03-25 10:31:22 273

原创 R语言绘图:时间序列分析 ggplot2绘制ACF PACF

R语言绘制时间序列自相关图和偏自相关图方法一Acf(DATA, type = "correlation")Acf(DATA, type = "partial")方法二library(ggfortify)autoplot(acf(DATA, plot = FALSE))方法三 运用ggplot2(推荐使用这种方式)bacf <- acf(DATA, plot = FALSE)bacfdf...

2018-03-24 21:50:07 16378 2

转载 R语言 高效的管道操作magrittr

文章转自:http://blog.fens.me/r-magrittr/前言使用R语言进行数据处理是非常方便的,几行代码就可以完成很复杂的操作。但是,对于数据的连续处理,还是有人觉得代码不好看,要么是长长的函数嵌套调用,有点像Lisp感觉,括号包一切;要么就是每次操作赋值一个临时变量,啰嗦。为什么就不能像Linux的管道一样优雅呢?magrittr包在这样场景中被开发出来,通过管道的方式让连续复杂...

2018-03-24 16:51:18 1801

原创 R语言重点学习模块

1、tidyverse2、CRAN Task ViewsBayesian Bayesian InferenceCluster Cluster Analysis & Finite Mixture ModelsDistributions Probability DistributionsEconometrics EconometricsEnvironmetrics Analysis of Ec...

2018-03-23 17:32:39 656

转载 R语言中plyr包

前言  apply族函数是R语言中很有特色的一类函数,包括了apply、sapply、lapply、tapply、aggregate等等。这一类函数本质上是将数据进行分割、计算和整合。它们在数据分析的各个阶段都有很好的用处。例如在数据准备阶段,我们可以按某个标准将数据分组,然后获得各组的统计描述。或是在建模阶段,为不同组的数据建立模型并比较建模结果。apply族函数与Google提出的mapred...

2018-03-22 16:30:58 1032

原创 R语言包学习列表

一、时间序列分析二、空间数据分析三、时空数据分析 四、数据可视化(1) shiny:提供一些基础的交互可视化控件。语法灵活,也支持html, JavaScript, markdown等等等五、数据整合与重塑六、字符处理七、大数据SparkR官网网址:R语言地址:常见学习博客Sparklyr官网网址:R语言地址:常见学习博客八、并行计算Rstudio 数据整合项目(1)tidyverse一词中的ti...

2018-03-22 16:15:19 1242

转载 R语言Data Frame数据框常用操作

Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的。Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那么就是从1开始自增的Sequence来标识每一行。初始化使用data.frame函数就可以初始化一个Data Frame。比如我们要初始化一个student的Data Fr...

2018-03-20 11:31:16 16111

转载 Basemap绘制地图

文章转自:http://blog.csdn.net/ouening/article/details/55227364使用folium实现中国地图绘制,文章链接:python/folium绘制中国人口数量热力图(HeatMap)今天发现另一个软件库folium可以实现对openstreetmap的调用,参考链接http://blog.csdn.net/qq_14906811/article/deta...

2018-03-20 10:20:10 8396 2

原创 Anaconda中 安装basemap包

Basemap 是matplotlib子包,也是python中最常用、最方便的地理数据可视化工具之一。使用传统python安装包的方法(pip install basemap 或者conda install basemap)经常报错,提示结果为Python 2.7 basemap和Python 3.6冲突(图),尽管2.7非常经典且世面大多数资料仍然是基于2.X版本,但官方已经宣布2.X版本只维护...

2018-03-20 09:39:28 24102

转载 R语言中进行文件夹及文件夹内文件操作范例

rm(list=ls()) path = ‘J:/lab/EX29 –在R语言中进行文件(夹)操作’ setwd(path) cat(“file A\n”, file=”A”) #创建一个文件A,文件内容是’file A’,’\n’表示换行,这是一个很好的习惯 cat(“file B\n”, file=”B”) #创建一个文件B file.append(“A”, “B”) #将文件B的内容附到A内...

2018-03-19 21:10:46 9939

转载 R 数据导入读取read.table函数详解

【R】数据导入读取read.table函数详解,如何读取不规则的数据(fill=T)函数 read.table 是读取矩形格子状数据最为便利的方式。因为实际可能遇到的情况比较多,所以预设了一些函数。这些函数调用了 read.table 但改变了它的一些默认参数。注意,read.table 不是一种有效地读大数值矩阵的方法:见下面的 scan 函数。一些需要考虑到问题是:编码问题如果文件中包含非-A...

2018-03-19 21:07:36 40293

转载 R语言-循环repeat,while,for,foreach,iter,next,break

R中有三种不同的循环结构:1.repeat结构它只是简单的重复同一个表达式:repeat expression,如果要跳出循环,可以使用break命令,若要跳至循环中的下一轮迭代,需要使用next命令;如果在循环中不包括break命令,R代码将会是一个无限循环。因此,常用的结构如下:123456repeat {   expression   if(condition){        break ...

2018-03-19 15:40:07 26503 1

转载 R语言中的缺失值处理

作者 Selva Prabhakaran译者 钱亦欣在处理一些真实数据时,样本中往往会包含缺失值(Missing values)。我们需要对缺失值进行适宜的处理,才能建立更为有效的模型,使得后续预测分析能有更小的偏差。本文将罗列不同的缺失值处理方法,并进行具体应用。数据准备和缺失模式设定本文使用mlbench包中的BostonHousing数据集作为示例来演示不同的缺失值处理方法。由于原始的数据集...

2018-03-19 11:07:43 14370

转载 R语言-数据预处理(二)

一、相关数据处理R包1、dplyr包install.packages("dplyr")install.packages("Lahman")install.packages("hflights")示范数据library(Lahman): Lahman 包里的棒球比赛数据集 Battinglibrary(hflights): hflights 包里的飞机航班数据将过长过大的数据集转换为显示更友好的 t...

2018-03-19 10:42:41 6531

转载 R语言--数据预处理(二)

一、R中数据集的相关操作1、创建数据集  hospital <- c("New York", "California")  patients <- c(150, 350)  costs <- c(3.1, 2.5)  df <- data.frame(hospital, patients, costs)2、创建新的变量df$totcosts <- df$patient...

2018-03-19 10:34:59 1782

转载 R语言---数据源

一、rjson及RJSONIO包介绍rjson是一个R语言与json进行转的包,是一个非常简单的包,支持用 C类库转型和R语言本身转型两种方式。rjson库,提供的函数只有3个,fromJSON(), newJSONParser(), toJSON()。 JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。易于阅读和编写,同时也易于机器解析和生成。 JSON...

2018-03-19 10:33:39 1407

转载 R语言与DataFrame

文章转自:https://segmentfault.com/a/1190000004621068什么是DataFrame引用 r-tutor上的定义:DataFrame 是一个表格或者类似二维数组的结构,它的各行表示一个实例,各列表示一个变量。没错,DataFrame就是类似于Excel表格和MySQL数据库一样是一个结构化的数据体。而这种结构化的数据体是当代数据流编程中的中流砥柱,几乎所有先进算...

2018-03-19 09:55:23 4729

原创 R语言--批量读取和写入目录

       在对很多数据处理时,通常要循环读取文件夹中的文件,这个时候需要批量读取和写入文件,在R语言中,批量读取和写入文件夹中文件的方法如下所示。批量读取文件##读取同一目录下的所有文件path <- "E:/实验数据/UseData/2013"fileNames <- dir(path) filePath <- sapply(fileNames, function(x...

2018-03-18 15:52:35 13139 1

转载 R语言字符串处理--stringr包

本文转载自:https://www.cnblogs.com/nxld/p/6062950.html 1. stringr介绍stringr包被定义为一致的、简单易用的字符串工具集。所有的函数和参数定义都具有一致性,比如,用相同的方法进行NA处理和0长度的向量处理。字符串处理虽然不是R语言中最主要的功能,却也是必不可少的,数据清洗、可视化等的操作都会用到。对于R语言本身的base包提供的字符串基础函...

2018-03-18 14:48:05 49590 1

转载 Rstudio中使用GitHub

首先假设R的project已经建好并且有GitHub账号,接下来想将其添加到GitHub中。这里使用GitHub for window客户端来操作。1. 在Rstudio中打开该项目,然后:Tools ->  Version Control -> Project Setup2. 如下图所示 3. 接下来是这样,如果第二步完成没有出现下面这个窗口,那么重新第一步,并在第二步里的箭头2处选...

2018-03-18 10:03:38 3987

转载 一些与R语言有关的书籍、课程

文章转自:https://d.cosx.org/d/419391-rBiomedical Data Science 生物医学数据科学 视频 Rmd源文件 书 课程edXAnalysis of Spatial and Temporal Data Lecture Slides、 JAGS和 R codeComputational and Inferentinal Thinking: The Found...

2018-03-18 08:17:25 2641

原创 一、R语言Task View--Spatial 空间数据分析

Task View index:  https://cloud.r-project.org/web/views/Spatial.htmlTask View 安装方法:(1)安装 CRAN Task Views 包install.packages("ctv")library("ctv")(2)安装Spatial install.views("Spatial")或者update.views("Spat...

2018-03-17 23:38:55 3490 1

原创 R语言绘制矩阵热图的包总结

d3heatmap  https://cran.r-project.org/web/packages/d3heatmap/index.htmlwheatmap  https://github.com/zwdzwd/wheatmapheatmaply  https://github.com/talgalili/heatmaplyheatmap3  https://cran.r-project.org...

2018-03-17 22:11:58 6018

转载 Rstudio 中创建一个R包,并且把包push到github

假设已经安装好Rstudio并且安装了git 开发工具,且有github账户。 如果没有github,以及没有链接本地和远程仓库的,请看这篇博文: git SSH key 生成步骤 在Rstudio中创建一个R的包如下程序: 1)在Rstudio中打开new project》 new dictionary 》Rpackage ,给包起个名:myGWAS 如下图所示: 2)编辑DESCRIPTION...

2018-03-17 17:16:12 2656

转载 R语言地图可视化

https://zhuanlan.zhihu.com/p/28205002?utm_source=tuicool&utm_medium=referral之前的ggplot2入门实践篇已经更新告一段落,也已经做了归总分类分享给大家。最近翻看突然发现少了一个知识点,就是分面中没有讲填充多边形分面的应用,虽然其理念跟其他的常用图表类型一致。但是鉴于多边形填充本身就比较复杂,再加上分面肯定能把大部...

2018-03-16 10:58:35 10430 1

转载 七、R数据可视化--ggplot2定位之坐标系详解

坐标系是将两种位置标度结合在一起组成的2维定位系统。ggplot2包含了6种不同的坐标系:名字描述cartesianequalfliptransmappolar笛卡尔坐标系同尺度笛卡尔坐标系翻转的笛卡尔坐标系变换的笛卡尔坐标系地图射影极坐标系坐标系主要有两大功能:将2个位置图形属性组合起来在图形中形成2维方位系统。位置图形属性分别被称为x和y,但将它们称作位置1和位置2可能会更适合,因为图形位置属...

2018-03-16 10:57:58 2849

转载 六、R语言可视化--ggplot2定位之分面

分面也就是切割数据生成一系列小联号图,每个小图表示不同的数据子集。本篇将讨论如何较好的微调分面,特别是与位置标度相近的方法。在qplot中可以选择分面系统。2维分面使用face_grid,1维分面使用face_wrap。分面通常会占用大量空间,因此本篇使用mpg数据集的子集来进行展示。12> library(ggplot2)> mpg2 <- subset(mpg,cyl != ...

2018-03-15 21:05:52 2967 1

转载 五、R语言可视化--ggplot2之标度、坐标轴和图例详解

本文转自:http://www.cnblogs.com/lizhilei-123/p/6808370.html标度控制着数据到图形属性的映射,当有需要时,ggplot2会自动添加一个默认的标度。我们确实可以在不了解标度运行原理的情况下画出许多图形,但理解标度并学会如何操纵它们则将赋予我们对图形更强的控制能力。每一种图形属性都拥有一个默认的标度,此标度将在我们每次使用这个图形属性时被自动添加到图形中...

2018-03-15 21:02:58 16529 2

转载 三、R语言可视化--ggplot2和REmap包绘制地图

绘制地图1.ggplot2提供了一些工具,让使用maps包绘制的地图与其他ggplot2图形的结合变得十分方便。关于中国地图的绘制可以参考:http://cos.name/2009/07/drawing-china-map-using-r/国家maps地图数据名法国意大利新西兰美国(郡)美国(州)美国(边界)全世界franceitalynzcountrystateusaworld 我们使用地图数据...

2018-03-15 20:54:04 19229 1

转载 二、R语言可视化-ggplot2工具箱

转载来自:http://www.cnblogs.com/lizhilei-123/p/6725588.htmlggplot2工具箱 ggplot2的图层化架构让我们以一种结构化的方法来设计和构建图形,这里每一小节解决一个特定的作图问题。1.基本图形类型geom_area()用于绘制面积图geom_bar(stat="identity")绘制条形图,我们需要指定stat=“identity”,因为默...

2018-03-15 20:52:45 1429

转载 一、R语言可视化--ggplot2之快速作图qplot()

转载来自:http://www.cnblogs.com/lizhilei-123/p/6722116.htmlggplot2之快速作图qplot()qplot()的意思是快速作图,利用它可以很方便的创建各种复杂的图形,其他系统需要好几行代码才能解决的问题,用qplot只需要一行就能完成。本篇主要介绍:qplot()的基本用法如何将变量映射到图形属性上(如大小、颜色和形状等)如何通过指定不同的几何对...

2018-03-15 20:50:53 4513

原创 R语言-创建属于自己的调色板

基于几种颜色创建属于我自己的调色板主要有以下几个方面:将颜色与其对应的十六进制矢量联系起来创建访问十六进制矢量的函数调色板命名访问调用调色板创建兼容ggplot2的尺度函数首先我们创建一个颜色变量library(ggplot2)theme_set(theme_minimal())my_colors <- c( `purple` = "#7b0099", `yellow` = "#...

2018-03-15 20:11:21 4805

原创 相关矩阵可视化包ggcorrplot

       基于ggplot2包以及corrplot包的相关矩阵可视化包ggcorrplot,ggcorrplot包提供对相关矩阵重排序以及在相关图中展示显著性水平的方法,同时也能计算相关性p-valuelibrary(ggcorrplot)#计算相关矩阵(cor()计算结果不提供p-value)data("mtcars")corr <- round(cor(mtcars), 1)head...

2018-03-15 19:52:28 3111

转载 R中ifelse、which、%in%的用法

在R学习过程中,遇到了ifelse、which、%in%,下面分别举例,说明他们的用法。1、ifelseifelse(test, yes, no)test为真,输出yes值,否则输出no值。举例如下:> x <- c(1,1,1,0,0,1,1)> ifelse(x != 1, 1, 0) #若果x的值不等于1,输出1,否则输出0[1] 0 0 0 1 1 0 0 2、which...

2018-03-15 17:02:12 1728

台球运动中主球运动轨迹的仿真分析

台球运动中主球运动轨迹的仿真分析

2014-10-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除