自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

岁月催猪老

别听他的叨哔叨

  • 博客(40)
  • 收藏
  • 关注

原创 R Package ggvis Flashback

ggvis is an awesome data visualization package which builds data graphics with a syntax similar to ggplot2 and creates rich interactive plots like shiny.

2015-10-07 22:49:58 1664

原创 两台设备中同步Hexo博客

现在时不时会在Ubuntu系统中编辑文档,将这个系统中的.md编辑完在发回WIN7系统deploy到hexo是一个很烦的过程,尤其是这事儿以后会经常发生的时候。 所以必须寻求一个解决方案,可以在Ubuntu中同样设定一个hexo的文件夹,并通过github同步数据源。

2015-10-07 22:39:50 3055

原创 R Markdown Review

Quoting the introduction on RStudio official site:R Markdown is an authoring format that enables easy creation of dynamic documents, presentations, and reports from R.

2015-10-02 19:23:28 1517

原创 Ubuntu 14.04 卸载搜狗拼音输入法及后续问题解决

安装搜狗拼音折腾了很久,安装好了以后,法语和日语键盘死活不能调用出来,也不知道为什么。 想想现在版本下的默认拼音功能已经足够,于是就准备删除搜狗了。

2015-10-02 17:53:47 4947

原创 Install jdk8 on Ubuntu 14.04

JDK is an important tool which consists the base of Java programming as well as supports many other programming IDEs. This article introduces the installation method of Oracle jdk 8 on Ubuntu 14.04.

2015-09-25 21:10:53 1144

原创 data.table Way - Learning Note Part 2

We resume the learning note.

2015-09-25 21:01:20 1663

原创 data.table Way - Learning Note Part 1

This is a learning note for the course Data Analysis in R, the data.table Way. This course introduces the package ‘data.table’ which is a very powerful tool for data manipulation. I borrow two built-i

2015-09-23 21:42:12 1950

原创 Install R and RStudio on Ubuntu

I wanted to try Linux system thus I formatted an old laptop bought 7 years ago (HP Pavilion dm3, French keyboard).

2015-09-23 21:40:47 1400

原创 Scraping Data Table from Website by R

For many quantitative analysis, we often consider factors such climate or economics data. Those data are usually displayed as tables on the websites and can be collected from there.

2015-09-23 21:38:47 1187

原创 R: 如何理解变量和环境的Lexical Scoping Rule

非IT出身,看到Scoping Rule神马的是非常头疼的,尤其是需要涉及到Function的嵌套的时候,很容易将不同environment种的变量弄混淆,还是自己动手实践一下比较好。在一个Function中,对一个变量的lexical scoping rule的检索次序是,先检查本Function中的environment,如果能找到该变量,则返回该变量,如果不能,则检索这个Function

2015-04-21 11:01:38 3910

原创 R版本更新 - installr包

很久没有更新R,但是又想去R的官网上去看有没有版本更新,怎么办?install.packages("installr")require(installr)这两行命令可以在RStudio或者R上运行。installr包有一系列的函数updateR, install.R, install.RStudio, install.Rtools, install.pandoc, install.

2015-03-11 18:47:46 16332

转载 Learning Time Series with R

by Joseph Rickert 原文地址Late last Saturday afternoon I was reading in my usual spot at the Dana Street Coffee House in Mt. View. A stranger walking by my table noticed my copy of Madsen’sTime Seri

2015-03-11 17:33:01 1235

转载 Updating R from R (on Windows) – using the {installr} package

原文见此Upgrading R on Windows is not easy. While the R FAQ offer guidelines, some users may prefer to simply run a command in order to upgrade their R to the latest version. That is what then

2015-03-09 15:28:54 760

原创 ACCESS 2013 Learning Note II

4. Queries4.1 Simple Queries:Select a table -> Navigation Bar -> Tab "CREATE" -> Tile "Queries" -> Query Wizard -> Simple Query Wizard -> follow the instructionSummary function available for n

2015-01-29 14:07:33 638

原创 ACCESS 2013 Learning Note I

1. Conception to Be Noticed1.1 Database normalization:first normal form (1NF): each cell of a table contains only a single value;second normal form (2NF): data not dependent on the primary key

2015-01-28 18:05:56 618

原创 R: RStudio的中文读取、保存与显示

做中文文本挖掘的时候经常要读取中文网站上的信息,但英文系统RStudio在WINDOWS系统下有无法完全兼容中文字符,所以print到显示器上的中文字符统统是乱码。处理方法如下:首先修改系统语言:Control Panel -> Region and Language -> Formats -> Chinese (Simplified, PRC)Control Panel -> R

2015-01-16 14:44:08 22649

原创 R:文本挖掘学习笔记1 - tm Package

1. 文件读取和查看DirSource()Corpus()inspect()tm 提供五种资源读取的方式:> getSources()[1] "DataframeSource" "DirSource"       "URISource"       "VectorSource"    "XMLSource"    仅就.txt文件而言,学习初期常用的是直

2015-01-06 14:02:30 11119

原创 R: 矩阵运算及常用函数 V - plyr Part I

plyr是莱斯大学的Hardley Wickham大神的杰作之一(如果你没听说过这个人——ggplot也是他开发的。。。),他以split - apply - combine (SAC)的模式和理念自己写了这么一个函数包。plyr函数系列的命名方式很简单,后缀-ply是通用名,前缀分两个部分,第一个字母是input的数据结构,第二个字母是output的数据结构。一共有六种input和out

2014-12-10 15:54:59 1092

原创 R: 向量 vs. 数组 vs. 矩阵 vs. 数据框 vector vs. array vs. matrix vs. data.frame

在读R Document的时候经常会出现array这个词。array字面上很好理解,数组,但是数组跟矩阵、跟数据框(包括向量)有什么区别呢?-+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+-在C语言里(R就是基于C写出来的)也有数组这个概念,它是具有相同数据类型按

2014-12-02 14:51:14 6306

原创 R: 矩阵运算及常用函数 IV - *apply Part II

*apply的Part I 提到了apply, tapply, by, eapply四个函数,接下来我们看看剩下的几个。主要参数X和FUN的用法跟之前Part I里都差不多。-+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+-1.  lapply系列函数1. 1

2014-12-01 18:54:48 1238

原创 R: 矩阵运算及常用函数 III - *apply Part I

在”向量运算及常用函数I“里已经提到过,apply系列函数“主要用于某维度上某函数/方法的批量应用”,可以避免“控制流循环带来的高错误率以及漫长的响应时间”。为了比较响应时间,我们可以先做一个简单的测试:为一列数据做一一系列幂的变形,依据指数的sequence,生成一系列的新数据。然后用system.time()来测试运行的时间(如何解读system.time()结果)。test1

2014-11-28 16:51:41 1034

原创 EXCEL&VBA: 中国热力图 HeatMap of China

事先声明以下内容基本全部是学习大神刘万祥的热力型数据地图(HeatMap)做法详解做成的,基本算是一个学习笔记。其中我也添加了一些个人的见解和改进。(做这个热力图是给公司用的,其它是回家整理的,所以附件是英文,截图的excel是中文,有点混乱,但是不妨碍理解。)

2014-11-27 20:26:01 23961 11

原创 R: 矩阵运算及常用函数 II - aggregate

aggregate也是跟SAC有关系的一个函数(stats包中):先将对象分解为不同的组别(回忆一下split函数),然后分个处理,最后合并显示。具体地说,aggregate()函数将数据集(依据指定方法)拆分成不同子集,分别计算各自的统计数据,并(组合)返回计算结果。此函数一般对三种对象做处理:data.frame, formula 和 ts (即时间序列).参考EXCEL的

2014-11-26 17:05:12 7912 1

原创 R: 矩阵运算及常用函数 I - split

R有一个非常强大的向量计算的方式,可以避免控制流循环带来的高错误率以及漫长的响应时间。这里就涉及到一个数据转换的模式:split-apply-combine (图简单,接下来都简称SAC了)。大神曾就这个模式开发出了plyr包,并写了一篇文章叫The Split-Apply-Combine Strategy for Data Analysis. 有兴趣不妨一读。下面写的是我

2014-11-26 17:04:03 6099

原创 R: 字符查询匹配和替换 grep(...) - Pattern Matching and Replacement

R语言中文本处理的重要一环,而R里面最强大的文本处理公式就是grep()一类的general函数(无需添加任何新的package)。grep的全称是global search regular expression and print out the line,是Unix下一种强大的文本搜索工具,可以通过正则表达式搜索文本,并把匹配的行打印出来[1]。-+--+--+--+--+--

2014-11-25 16:57:02 35411

原创 R: 使用source()函数引用网络数据文件时,系统适配性问题

source()常见于引用本地文件或者网络文件。引用网络文件的常见案例为

2014-11-18 19:34:08 3852

原创 R: 如何批量安装R包 (R packages installation in bulk)

写自定义函数的时候常常会遇到一次性需要导入很多

2014-11-18 19:03:10 8567

原创 VBA: 小数存储精度问题single vs. double

在写程序的时候发现了zhe

2014-09-18 16:27:05 12947 1

原创 R: 数据排序函数 sort(), rank(), order()

目前接触到

2014-08-25 10:03:58 3709

原创 R: anova或linear model 的 MAPE计算

在R的summary()基本功能里,对“lm"huoz

2014-08-07 12:01:37 9814

原创 R: 控制台的清理与输出内容的保存 (Clear Console & Save Console Output)

控制台

2014-07-30 10:12:42 34516 3

转载 Statistical Language Wars: The Infograph

Source: blog.datacamp.com

2014-07-21 18:20:50 786

原创 R: 循环语句中warning()的显示问题

以下是我一个自定义函数的一段内容

2014-07-16 15:29:33 10082

原创 Rmarkdown / knitr WINDOWS 系统下中文显示

WINDOWS系统下,用Rmarkdown无法直接将中文zhu

2014-07-04 17:17:26 5609

原创 用阶乘函数factorial()求排列组合之和

前段时间要做一个模型,初始

2014-06-11 12:03:21 4147 1

原创 R转换.csv文件格式到.txt或.xlsx) [read.csv and export data to .txt or .xlsx]

现有多份文件名相似的.csv格式文件

2014-04-16 18:36:22 8914

原创 控件, offset与name manager的简单协同使用

数据: 不同城市每月的平均温度目的: 通过选择上图右侧控件中的城市,得到一行对应的每月平均温度值,并以此作图(如下图)思路: 1. 用OFFSET实现数据的动态选择;2. 命名这个OFFSET命名City返回控件中选择的城市,命名Temp返回控件所选城市对应的12个月的每月平均气温。Temp_Alt是得到12个月每月气温的另一种方法,稍后可以谈到两者的区别。

2014-04-02 12:18:03 2405

原创 控制语句 VBA vs. R vs. Python (1) if...语句

IF的应用及对比例:顶上战争后,如果罗没有就路飞,则路飞死去,反之,路飞活着;如果之后雷利找到了路飞,则路飞在接下来的两年内学会霸气,反之,两年后进入新世界,草帽团团灭。VBA:If Law_Saved_Luffy = False Then Luffy == "Dead!"ElseIf Raily_Found_Luffy = True Then Luffy = "NewS

2014-03-07 20:58:13 1372

转载 假设检验初步 [胡江堂]

假设检验初步准备再尝试一下,用大白话叙述一遍统计推断中最基础的东西(假设检验、P值、……),算是把这段时间的阅读和思考做个梳理(东西不难,思考侧重在如何表述和展示)。这次打算用一种“迂回的”表达方式,比如,本文从我们的日常逻辑推理开始说起。0.普通逻辑复习一下普通逻辑的基本思路。假设以下陈述为真:你打了某种疫苗P,就不会得某种流行病Q。我们把这个先决条件表述如下

2014-03-06 22:24:08 1932 1

原创 EXCEL 控制图(自动更新/比较不同时间段/调用不同变量) Control Charts

阿德司法

2014-03-05 17:24:20 3286

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除