自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

偷闲阁

提高技术是为了工作中能够偷懒~

  • 博客(26)
  • 收藏
  • 关注

原创 R语言作图:图例设置

今天总结一下R语言底层作图的图例设置,主要是legend函数的用法。legend(x, y = NULL, legend, fill = NULL, col = par("col"), border = "black", lty, lwd, pch, angle = 45, density = NULL, bty = "o", bg = par("bg"), box.lwd = par("lwd"), box.lty = par("lty"), box.c...

2021-07-05 22:37:11 33775

原创 R语言:排序的应用

工作中遇到过许多看起来挺复杂的数据筛选,本质上都可以用排序解决,这里以R自带的mtcar数据集为例做一个记录。 首先简单介绍一下mtcar数据集,mtcar(Motor Trend Car Road Tests)是一个32行11列的数据集,记录了32种汽车的11种性能,具体数据如下:> mtcars mpg cyl disp hp drat wt qsec vs am gear carbMazda RX4 ...

2021-02-17 17:04:38 1117

原创 RStudio快捷键

记录一些常用的快捷键注释:Ctrl+Shift+C执行代码: Ctrl+Enter查找:Ctrl+F保存:Ctrl+S撤销:Ctrl+Z回复:Ctrl+Y

2021-01-30 13:34:23 2615

原创 R语言:并行计算

一直以来,总觉得并行计算是种很高深的技术,需要系统性的学习才能掌握。直到最近工作中进行大量循环计算,动辄十几个小时,实在是被整崩溃了,于是百度了一下,惊喜的发现R有很傻瓜的并行计算用法,完全满足基本的计算需求,这里简单记录一下。R语言的并行可以用parallel包,这个包是自带的,不用下载,直接library即可。它本质上相当于打开多个R控制台,然后将任务拆分后让这些控制台计算,等各部分计算完成后再合在一起呈现出来。完成一次并行计算需要的函数主要有:makeCluster、clusterExport

2020-08-23 16:41:54 4630 1

原创 R语言计量:Newey-West调整

  在计量经济学中,经常要对时间序列数据进行回归建模。时间序列数据通常具有异方差(Heteroscedasticity)和自相关(Autocorrelation)的性质,此时使用传统的最小二乘法(OLS)估计回归参数虽然仍可得到参数的无偏估计,但是传统方法计算出来的参数方差具有偏差,会导致参数的t检验不准确,常出现虚假显著的情况。为避免这种情况,计量经济学中常对上述参数的方差进行调整,最常用的是N...

2019-04-01 20:12:48 17493 3

原创 R语言:数字格式

  科学计算常对数字格式有所要求,最常见的就是保留数字的有效位数。在R语言中处理数字格式的函数主要有round、signif、sprintf和format。  最常用的round(x, digits = 0)函数是四舍五入保留有效位数,其参数x是要进行处理的数据,digits是从小数点算起要保留的有效位数。注意,digits可以取负数,假如取-2,即意味着保留百位数。另外,尽管round是四舍...

2019-03-28 12:12:27 12462

原创 R语言可视化:使用ggplot2绘制人口金字塔

  人口金字塔是进行人口数据可视化时常用的一种统计图形,可以形象地描述人口年龄和性别的分布情况。最近工作上经常处理人口数据,于是试着使用ggplot2绘制了一下。在这里记录一下,顺便也熟悉一下ggplot2的用法。  上图所示的人口金字塔是根据我国2010年人口普查的相关数据进行绘制的,绘制过程主要分为以下三部分,(1)数据爬取,(2)分面设置以及(3)图形绘制。1、数据爬取  如...

2018-08-17 01:08:13 10014 3

原创 R语言量化:MACD的计算及使用

   MACD,中文名称为指数平滑移动平均线,是最常用的技术指标之一。该指标由双指数移动平均线发展而来,其意义和双移动平均线基本相同,即由快、慢均线的离散、聚合表征当前的多空状态和股价可能的发展变化趋势。与双指数移动平均线相比,MACD采用红绿柱的表现形式,阅读起来更加方便。其计算方法如下:  1、由快的指数移动平均线(EMA12)减去慢的指数移动平均线(EMA26)得到DIF;  2、计算DIF...

2018-05-01 14:18:23 7675 2

原创 R语言量化:KDJ指标的计算

  KDJ指标,中文名随机指标,由乔治·莱恩(GeorgeLane)创立,是目前期货和股票市场上常用的技术分析指标。KDJ指标在设计过程中主要是研究最高价、最低价和收盘价之间的关系,体现市场情绪,可以用来测度超买或超卖现象,被广泛应用于中短期趋势分析中。  一般说来,K线超过90意味着超买,K线低于10意味着超卖;D线超过80意味着超买,D线低于20意味着超卖;K线在低位上穿D线为“金叉”是买入信...

2018-03-02 20:54:58 7319 4

原创 R语言:排序、筛选以及分类汇总操作

  在Excel中我们可以很方便的对数据进行排序、筛选、分类汇总等基本操作,R语言中没有这种傻瓜式的一键操作,如何才能完成这种操作?一、排序1、单变量序列排序  单变量序列的排序常用到rank、sort和order函数。  给一个例子:> a <- c(3, 1, 5)> rank(a)[1] 2 1 3> sort(a)[1] 1 3 5> order(a...

2018-02-26 21:25:54 231998 9

原创 R语言量化:alpha和beta的用法——所谓“股性”和alpha策略

  在R语言量化:alpha值和beta值中我们介绍了beta和alpha的含义和计算方法。beta除了可以用于资产定价,在二级市场中也有着广泛的用途,例如可以用来判断股性以及构建投资策略。一、beta与“股性”  所谓股性,指的是股票价格在长期运行中表现出来的某些特性或规律,特指个股收益对市场变动的敏感程度。因为beta表示的是市场每获得1%的收益时,个股所获收益的百分点,所以可以使用beta对...

2018-02-24 23:47:36 12322 1

原创 R语言量化:alpha值和beta值

  量化投资中经常提到的alpha(收益)和beta(收益)是从资本资产定价模型(CAPM)中衍生出来的概念。CAPM是一个给风险定价的基本模型,它认为只有系统风险(Systematic risk)才能带来收益。这是因为非系统风险(Nonsystematic risk)可以通过投资组合的方式消除掉,如果非系统风险也可以带来收益,就意味着人们可以通过构建投资组合的方式不承担风险而白得收益,这种情况下...

2018-02-19 15:03:03 29236 1

原创 R语言:常用数据格式及其操作

1、 vector格式  vector是一维的数据集合,其数据必须为同一类型,例如都是int型,都是character型。一个原本全是数字组成的vector中一个元素替换为字母时,其余元素也会变为character型。> a <- 1:6> str(a) int[1:6] 1 2 3 4 5 6> a[1] <- 'a'> str(a) chr[1:6...

2018-02-16 23:29:19 19348 2

原创 R语言量化:使用WindR下载Wind数据

  在R语言:使用rvest包抓取新浪财经A股交易数据中我们介绍了如何使用rvest包爬取新浪财经的A股交易数据,但是新浪有一定的反爬虫措施,抓取数据多有不便。最近发现Wind有R语言的量化接口,而且对免费用户也给出了一定的数据权限,于是学习了一下如何使用Wind下载股票数据。一、R插件的安装  Wind量化接口的相关介绍都可以在首页的【量化】目录下找到,Wind支持C++、C#、VBA、Marl...

2018-02-12 14:13:09 12315 1

原创 R语言:文本处理(字符串处理)的常用函数

文字太多,一眼找不到要找的内容? Ctrl+F 即可查找~  R语言中处理字符串主要用到base包(R语言自带)和stringr包(需下载安装)的一些函数,现总结如下:1、字符串长度  nchar()函数用于计算字符串长度;nzchar()函数则用于判断字符串长度是否大于0,大于0则返回TRUE,否则返回FALSE。  函数参数设置如下:  nchar(x, type = "chars",allo...

2018-02-08 09:51:30 20227 2

原创 R语言作图:数学公式

在使用R语言作图时,有时需要在图上标注诸如求和、积分、上下标等数学符号,该操作可以通过expression函数完成。  expression(...)  括号中输入数学表达式,配合plot、text、title、axis等函数使用,可以将数学公式绘制在图表上。x <- seq(0, 4, 0.01)y <- sqrt(x)tt <- expression(y == sqrt(x

2018-02-07 18:44:07 33313

原创 R语言作图:坐标轴设置

  要绘制一张赏心悦目的统计图表,坐标轴的设置至关重要。在R语言底层作图中,对坐标轴的调整主要通过调整plot函数、axis函数和title函数的一系列参数完成。plot(x,y, ...)axis(side,at = NULL, labels = TRUE, tick = TRUE, line = NA, pos= NA, outer = FALSE, font = NA, ...

2018-02-04 20:51:24 283014 13

原创 R语言:文件操作

在批量处理数据时,通常需要对文件或文件夹进行操作,下面将R语言中处理文件和文件夹的常用函数整理一下。1、工作路径getwd()        列出当前工作路径;setwd(dir)    设置工作路径,参数dir是要设置的路径。2、列出目录下文件函数list.files和dir用法完全一样,可以列出路径下所有文件(包括目录);函数list.dirs只列出路径下所有目录。

2018-02-03 22:04:04 22157

原创 R语言:函数的多重嵌套

   在R语言的数据处理中,一般来说,为了完成某项操作通常需要使用不止一个函数。往往需要把上一个函数的结果作为下一个函数的输入值,嵌套多次之后才得到最终的结果。在这种情况下,无论是使用一连串括号把函数嵌套起来,还是定义一系列中间变量一步一步做下去,都会显得繁琐而逻辑不清。举个例子,假如我们想计算出http://blog.csdn.net/weixin_40628687页面中所有博文的点击量最大...

2018-01-17 16:30:24 9947

原创 R语言爬虫:RSelenium包常用函数

文字太多,一眼找不到要找的内容? Ctrl+F 即可查找~  使用RSelenium包控制浏览器主要依靠remoteDriver系列函数:  remoteDriver( remoteServerAddr,         port,         browserName,         path,         version,

2018-01-09 09:05:50 6963

原创 R语言:RSelenium包爬取动态网页

目前很多网站的数据采用异步加载的方式呈现,以进口商品统计月报为例,当我们点击下一页时,表格中的数据会更新,但是网站的URL不会发生变化。对于这种网站,如果使用rvest包或RCurl包进行爬取,只能抓到第一页的数据。不过不用担心,对付这种情况,可以使用R语言中RSelenium包。  RSelenium包可以通过调用Selenium Server来模拟浏览器环境,它可以模拟浏览器的点击、滚

2018-01-07 23:28:58 12602 3

原创 R语言爬取动态网页:使用RSelenium包和Rwebdriver包的前期准备

  在使用rvest包抓取新浪财经A股交易数据中我们介绍了rvest包的用法,然而rvest包只能抓取静态网页,而对诸如ajax异步加载的动态网页结构无能为力。在R语言中,爬取这类网页可以使用RSelenium包和Rwebdriver包。  RSelenium包和Rwebdriver包都是通过调用Selenium Server来模拟浏览器环境。其中,Selenium是一个用于网页测试的Java...

2018-01-04 16:00:46 12933 11

原创 R语言:如何在一张图上画多个填色等值线图

在R语言:填色等值线图及其色标(color bar)设置中我们介绍了filled.contour函数的用法,它可以很方便的绘制带色标的填色等值线图。但是我们平时可能更多的需要将多个填色图放在同一张图上(如下图所示),这种图该如何绘制?相比R语言:填色等值线图及其色标(color bar)设置介绍的图形,这里的难点主要有两个,一是怎样进行分面,二是怎样在地图上绘制陆地轮廓,下面我们将依次解决

2017-12-09 01:50:28 12356 1

原创 R语言:使用rvest包抓取新浪财经A股交易数据

R语言网络爬虫工具中比较常用的包有RCurl、XML、rvest等,本文以新浪财经频道A股交易数据的抓取为例简单总结一下rvest包的用法。  首先介绍一下我们要抓取的对象,我们以“中信证券(600030)”为例,抓取其日度交易数据。url地址为http://vip.stock.finance.sina.com.cn/corp/go.php/vMS_FuQuanMarketHistory/st

2017-11-21 10:09:28 6893 1

原创 R语言:填色等值线图及其色标(color bar)设置

在气象数据分析中,经常用填色等值线图来表现气象要素的空间分布特点,R语言中filled.contour函数可以作出类似的图形。

2017-10-30 00:18:54 40248 9

原创 R语言处理气象数据:NetCDF格式数据的读写

下载的气象数据大多是NetCDF格式,也即.nc文档。在R中处理这类数据,可以用ncdf包或ncdf4包,最近把R更新为3.3.2版本后发现ncdf包不支持了,只能用ncdf4包,用法差不多,在这里记录一下。常用函数:nc_open 打开.nc文档nc_close 关闭.nc文档nc_create 新建.nc文档ncvar_get 读取变量数据nca

2017-10-21 19:11:50 44436 52

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除