- 博客(5)
- 收藏
- 关注
原创 R绘图散点覆盖问题
ggplot(diamonds, aes(x=carat, y=price))+ geom_point(alpha=.1)ggplot(diamonds, aes(x=carat, y=price))+ geom_point(alpha=.01)ggplot(diamonds, aes(x=carat, y=price))+ stat_bin2d()当其中的一个或者两个变量为离散型数据时
2017-11-01 20:30:02
2950
原创 Basic data manupulation
dplyrdplyr包主要是对数据进行处理(过滤,切分,聚合,join等操作)的一个非常强大的包。基于c++编写的,处理速度快 https://cran.rstudio.com/web/packages/dplyr/vignettes/introduction.html基本函数filter: 过滤观测select:过滤变量 选择符合条件的子集合同时支持 starts_with(),en
2017-10-05 21:37:56
246
原创 工具篇
工欲善其事,必先利其器成为一个好的数据分析科学家,必须要有一些好的工具在手。linux shell 编程gitlab的代码版本管理*markdown/bookdownbookdown是基于markdown,knitr用来进行write book的一个package。 其主要功能和markdown差不多,参考gitbook的方式,能基于Rmd或者md进行书写。加载一些html widgets
2017-10-05 21:23:01
240
原创 Remap
随着互联网时代的数据形式的多样化,空间数据的分析也越来越受到重视。基于用户、出租车的轨迹的交通优化,调度问题也越来越多的出现在一些大数据竞赛中,通过这种众包的形式,这类社会化问题逐渐得到一定程度的解决。REmap是一个基于Echarts(http://echarts.baidu.com/echarts2/doc/doc.html)的R pacakge,主要是提供一个渐变的可交互的地图可视化展现
2017-10-05 21:06:44
1045
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人