自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 R语言柱状图直方图 histogram

r语言柱状图,直方图。

2023-09-20 18:06:40 840

原创 R读写parquet文件

R语言如何读写parquet文件

2023-09-19 17:28:28 438

原创 R语言分组求和,分组求平均值,分组计数

我们经常可能需要把一个数据按照某一属性分组,然后计算一些统计值。在R语言里面,aggregate函数就可以办到。## S3 method for class 'data.frame'aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE)我们常用到的参数是:x, by, FUN。x, 你想要计算的属性或者列。by, 是一个list,可以指定一个或者多个列作为分组的基础。FUN, 指定一个函数,用来计算,可以作用在所有分组的数据上面。假如

2021-02-20 15:06:40 82129 8

原创 数据可视化工具Top5

今天看了看blog,看看大家都在用什么数据可视化工具。R很重要的一个功能就是强大的数据可视化,所以想看看除了R,Python这种语言类工具,大家还在用什么,看了很多文章,我list出来了这5个。1. Tableauhttps://www.tableau.com/zh-cn是现在很流行的可视化工具,但是收费很贵。有14天免费的Tableau Desktop可以试用,而且在Tableau里面还可以集成R语句进行Tableau不支持的运算。下来打算有时间试试这个集成。2. Microsoft Power

2020-09-28 17:51:26 550

原创 R读取XML数据

XML又叫可扩展标记语言,是一种具有结构性的标记语言,可以结构化的描述信息。XML最初的出现也是为了提供一个标准的数据格式。它便于数据共享,数据传输。也可以用于系统配置,内容管理。在R语言里面读写XML数据可用XML包。XML数据这个是我们这个文章使用的数据,来自 https://www.runoob.com/xml/xml-tree.html。<bookstore> ...

2020-04-11 21:17:14 4720

原创 R读取JSON

随着REST API越来越流行,JSON的使用也多了起来。我今天看看R如何读取JSON文件。这个是我们今天要读取的JSON数据:[ { "Name": "Mario", "Age": 32, "Occupation": "Plumber", "Ranking": 3 }, { "Name": "Peach", "Age": 21, ...

2020-04-11 17:00:40 4152

原创 R Markdown 表格

在上一篇我们讲了R Markdown的基础已经简单的例子。今天来看一下data.frame和matrix在R markdown里面如何展示。默认表格输出这个是直接写R code默认的在html文件里面的输出。library(rmarkdown)render("tables.Rmd", "html_document")格式化输出R里面提供了很多包可以用来格式化在rmarkdown里面...

2020-03-27 18:30:22 7732

原创 R Markdown

R Markdown简介markdown百度百科“Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。”R markdown就是markdown + R code。它可以:1)保存和执行代码;2)生成可以分享的报告;总的来说R Markdown用来将你的数据和R语言的分析过程和结果转化为文档报告,并且分享给别人。更重要的一点...

2020-03-24 15:37:16 1891

原创 女程序员工作十年感悟

1 关于男女研究生毕业作为一枚女程序员已经十年了。所呆过的几个公司和小组男生居多,女生比较少。组里的开发的架构和lead基本都是男生。也说不清楚这个是男性更适合这种工作还是说样本量太少。但是作为一名资深开发,我和组里其他男开发相比,一点也不逊色。但是此从有了小孩之后,感觉自己投入工作的关注度和精力是无法和男生相比的。作为队友的老公照顾小孩也很给力,但是小朋友还是比较粘妈妈。现在每天晚上等小孩睡...

2020-03-12 16:04:55 428

原创 R矩形树状图 treemap

简介treemap又叫矩形树状图。通过嵌套可以显示层次结构,不同与一般的树状图,它同时可以通过矩形面积大小显示数值。这个图片是用treemap包里面的treemap函数自带的demo script画的,显示的是2014年各个国家的人口数量。简单treemap我们先来画一个单层结构的treemap,就是没有嵌套的数据结构。用的数据是从csdn导出的文章访问数据。 ...

2020-03-09 17:52:15 3087 2

原创 R语言气泡图 bubble chart

简介气泡图可以显示三个数值型变量的关系。它是在散点图的基础上,又用气泡的大小来显示第三个数值变量。geom_point绘制气泡图geom_point可以绘制气泡图,只要设置size参数为一个数值变量就可以。这个是我们的数据。number,sales,percent,city12,23,0.45,A23,123,0.12,C45,12,0.78,A23,45,0.67,A32,...

2020-03-06 23:40:38 12284

原创 R语言折线图 line chart

简介折线图是用直线将各个数据点连接起来组成的图形。显示数据的变化趋势,一般是随时间的变化。这个图是北方一城市2019年一月份的高温变化。plotR语言base包里面自带的plot和lines可以画折线图。plot可以单独画折线图,lines必须是在其他图的基础之上,单独不可以。我们先看一个plot的例子。数据还是2019年北方城市一月份的高温。plot(x=tempData$日期,y=...

2020-03-04 16:30:50 4404

原创 R语言面积图 area chart

简介面积图展现了数值型变量随着另外一个变量变化的趋势。一般都是变量随时间的变化。面积图其实就是折线图,只是在线和X轴之间填满了颜色。面积图一般分为两种:重叠面积图,显示各个数值随时间或类别变化的趋势。每一个数值分别显示。有的时候数值会被隐藏起来。堆积面积图,各个数值堆积在一起显示总量。主要是part-to-whole的概念。不单单可以看出总量,而且可以看出每一个数值的对比和对总量的贡献。...

2020-03-01 18:59:33 7555 2

原创 R语言条形图 bar chart

条形图通过条形的高度或者长短来表示数据多少的图形。用来展示分类变量(categorical)的组成和分布。R语言的base包里面有barplot可以绘制条形图。ggplot2包里面有geom_bar可以绘制。barplotbarplot函数barplot(height, width = 1, space = NULL, names.arg = NULL, legend.te...

2020-02-26 19:35:55 5749 1

原创 R语言缺失值 missing values

R语言缺失值有的情况下,数据集里面有的数据值是不知道的,unknown values。对于数据分析来说,一个常见的功能就是缺失值的处理。R语言用NA表示缺失值,not available的意思。1. 缺失值例子数据文件:读入R:> df name age grade1 Lily 23 782 <NA> 24 863 Bob 25 8...

2020-02-23 20:05:13 16257 1

原创 R语言的点图dot plot

点图简介点图又叫Cleveland dot plot,克利夫兰点图。可以在水平线上绘制大量的点,更好的表示点之间的关系。强调数据的排序展示以及数据之间的差距。点图一般是横向展示,所以y轴为类别型变量,x轴为需要展示的数据值。dotchart函数dotchart(x, labels = NULL, groups = NULL, gdata = NULL, ann = par...

2020-02-19 23:25:22 9488

原创 R语言读取excel文件

R语言有很多package可以读取excel文件。我们今天先介绍其中的一种。xlsxxlsx是R语言读和写excel文件的一个包。允许读取excel的一个sheet为data.frame对象,并且把一个data.frame对象写回文件。底层实现,xlsx使用apache的一个java库来实现的。详细信息可以看这里http://poi.apache.org/index.html。可以在R G...

2020-02-17 14:47:22 5279

原创 R语言箱型图 boxplot

boxplot简介boxplot称为箱型图,又叫做盒状图,胡须图。是用来表示数值类型数据分布状况的统计图。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。四分位数百度百科第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。第三四分位数 (Q3)...

2020-02-06 18:24:39 21350 1

原创 R语言读取csv文件

csv文件Comma-Separated Values,逗号分隔符值,其文件以文本格式存储表格数据。read.csvR语言用read.csv读取csv文件,读取返回一个data.frame的内存对象。read.csv(file, header = TRUE, sep = ",", quote = "\"", dec = ".", fill = TRUE, comment....

2020-02-01 11:18:37 18427

原创 R语言查看函数源代码source code

function是有多个语句组成,完成一个特定的任务。R语言里面有很多内嵌的functions,用户也可以自己定义。比如说sort, summary, help都是R里面常用的function。我们如何查看一个R 函数function的源代码呢?在R里面,想查看一个function的源代码,直接输入function的名字,执行就可以。我们以sort为例子。> sortfunctio...

2019-12-31 10:47:53 3227

原创 R语言的字符串分割 split

R的字符串分割用常用的函数是strsplit。strsplit(x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)x是一个字符串。split分割是用到的字符分隔符。可以为正则表达式。空格分割例子strValue <- "Hello World Henry"strsplit(strValue, " ") #resul...

2019-12-09 17:36:12 17523

原创 R语言data.frame排序 sort

在这篇文章里面介绍了data.frame的基本操作data.frame基本操作。今天写一下data.frame的排序。R基本package里面用的比较多的排序function是order,sort是用来排序vector。order这个是order的用法order(..., na.last = TRUE, decreasing = FALSE, method = c("auto",...

2019-12-09 16:36:52 37426

原创 R语言的help

R提供了大量的help文档,会很有帮助。1. help.start()执行函数help.start()会打开一个浏览器,可以在其中查看各种文档。有基本的R语言介绍,有关于数据的导入导出,还有怎么开发自己的package。2. help(“sort”)查看函数sort的帮助文档。?sort,help(sort)也有同样的功能。3.??sort以sort为关键字在help文档中搜索。hel...

2019-11-29 14:16:57 6420

原创 R语言data.frame基本操作

R语言里面的data.frame就是数据库里面的table,R语言的分析,建模大部分都是基于data.frame数据结构,由rows和columns组成。data.frame每一个column会存储同样的数据类型,可以是numeric, factor, character.创建一个data.frameR用data.frame() function创建一个data.framedata.fr...

2019-10-12 14:32:56 20700 1

原创 R语言的饼图 Pie Chart

饼图是一种圆形统计图形,它被分成若干份来说明数字的比例。R语言里面可以用很多方法来画饼图:piepie(x, labels = names(x), edges = 200, radius = 0.8,clockwise = FALSE, init.angle = if(clockwise) 90 else 0,density = NULL, angle = 45, col = NULL...

2019-09-19 17:06:01 5699

原创 R语言的循环

R语言的循环和C++,Java都比较类似,但是比较简单,一般用于定义用户自己定义的function。forR的for循环的一般样式是: for (name in expr_1) expr_2name是循环的variable, expr_1是一个表示循环指的vector。我们看一个for的例子。repeatrepeat循环的样式是: repeat expr我们看一个repea...

2019-09-17 16:34:04 2107

原创 R语言的group

Group就是分组,在统计里面经常需要把数据按照某一个属性分组后继续算sum,mean之类的统计值。我们用R自带的数据CO2作为例子,Type表示植物所生长的地方,uptake表示二氧化碳吸收率。我们可以按照Type来把数据分组,看看uptake的平均值如何。这个只是简单的group,复杂的可以写代码用loop解决。还有就是R package dplyr提供了group_by的方法,比较好...

2019-08-20 15:50:04 3533

原创 分析stack overflow的关于R问题title

很好奇stack overflow上面的问题的语言分布,然后就用R语言调用它提供的REST API做了一个小程序测试一下。因为使用么有access_token的request会有请求限制,所有今天只是测试了一下R语言的问题。获取所有的R语言问题的title,然后画一个简单的word cloud看看。still因为token的问题,我的R title只有30100条。require("httr"...

2019-08-19 14:31:51 391

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除