R language
beyondma
一个温柔的程序员爸爸
展开
-
一文排除R语言热力图所有的坑
今天闲来无事,看到我国的人口屡创新创,准备使用R语言做个分析,把各省的出生率画个热力图出来,结果呢遇到很多雷,再次借CSDN的平台,把这一切记录一下,为各位看官排忧。闲话省说,先上效果图 首先一点,R语言做热力图想要最炫的效果得使用REmap这个包,不过这个包不是R语言官方CRAN上带的,一般从网上查到的资料都是说要用这种安装方法装library(devtoo...原创 2018-12-29 22:57:04 · 6081 阅读 · 3 评论 -
终于把AI换脸的原理搞清了
近日一段AI换脸视频火爆网络,一个网名叫换脸哥的Geek,将朱茵在94版射雕中的黄蓉换成了杨幂。后来甚至有的主播利用类似技术,在直播平台上利用实时换脸技术,直接把自己换成某些一线明星来吸引眼球。后来换脸哥直接下架了相关视频,并发声明称希望大家专注于技术本身。这起事件看起来只是一个娱乐版的头条,但是深入思考一下也会发现,视频换脸技术其实也给金融业普遍使用的如:客户交易视频资料留档、人...原创 2019-03-09 13:49:54 · 128676 阅读 · 53 评论 -
用Rword2vec告诉你券商的推荐买股票是否靠谱
最近国内A股走势不错,又有听到周边有不少同事打算入市了。那么咱们IT人员如果相关金融知识不多,又不想买基金交管费的话,跟着券商的推荐买行不行呢? 如果是零基础的朋友请参考https://blog.csdn.net/BEYONDMA/article/details/87902276文中的前四章节,装好R语言、RTOOLS、JAVA环境和selenmium,做好前期准备工作。...原创 2019-03-02 21:49:04 · 1965 阅读 · 1 评论 -
R语言如何确定股市交易日期,并利用tushare获取数据对事件影响进行回测
最近笔者在研究新闻事件与股票价格的相关关系。由于股市相对比较特殊,事件对于股价的影响时长更需要使用交易日的数据进行衡量,比如春节期间发生的重大事件,由于闭市其影响必须要在其后的交易日内才生显现,所以获取事件发生时是否处于股市的交易日,并研究事件发生后的若干个交易日内的股价变动情况,才能进行有效相应回测。 笔者首先想到的是先获取上证指数的交易信息,将其中的交易日期单...原创 2019-03-02 21:21:16 · 3462 阅读 · 0 评论 -
如何用爬虫技术帮助孩子秒到心仪的幼儿园(基础篇)
近来又到了幼儿园报名的季节了,身边很多朋友有很多都说起要高价请枪手帮助秒杀报名的,其实幼儿园报名本质上还是一个比较简单的任务,粗略来看这只是一个网页爬虫加自动答题的需求。去年博主为孩子进行幼儿园报名时用了selenium+python的方式,效果不错。今年我在研究R语言的过程中,发现这个看似最简单的R语言也可以做相应的秒杀。我把相关编程的思路整理了一下,供各位参考。我尽量将全部的细节说清...原创 2019-02-24 15:01:27 · 5066 阅读 · 5 评论 -
一文排除R语言傻瓜式抓虫的坑-全面抓取金融数据,零基础版
我们知道想搞金融大数据乃至量化分析,数据是最不可缺少的资源,但是由于很多金融人士对编程语言乃至爬虫的机制并不了解,甚至有些遍及而却步,所以造成了很多有识之士意愿从事兴趣甚至有意愿从事数据分析工作,但是较高的门槛也使很多人无法入门,那么我们这里就制作一个比较全面的教程,让大家能从零开始获得金融数据。 我们知道股票交易的数据分为行情类数字化数据和研究类文本数据两种,其中各...原创 2019-02-16 16:31:34 · 1566 阅读 · 0 评论 -
一文排除R语言抓取动态网页(selenium)所有的坑
最近一直在搞R语言结合自然语言处理,分析公司研究报告相关的课题,但是鉴于单位的数据不能拿出来研究,所以周末在家只能看看如何从网上抓取相关数据了,效果也还不错,可以在网上把各大券商的相关研究报告的评级,推荐时间,股票代码以及研究报告的文本全部抓取出来。具体如下图,示例可在https://download.csdn.net/download/beyondma/10928992下载:...原创 2019-01-20 18:56:24 · 2297 阅读 · 0 评论 -
使用R语言抓取A股股价数据
不出所料使用R抓取A股的股价又是一个非常轻松的事。上午刚刚说到咱们可以轻松拿到各证券的研报信息,那么咱们如果想分析一下,研报对于股价的影响,应该如何做呢?一、还是安装包install.packages("PerformanceAnalytics")library(PerformanceAnalytics)install.packages("quantmod")library(quan...原创 2018-12-31 20:54:43 · 5268 阅读 · 0 评论 -
使用R语言抓取PDF中的文本数据
最近一直在使用R语言做一些数据分析,简单记一下心得,今天的题目是使用R语言抓取PDF中的文本数据,在实际工作中经常文本数据常常不是标准化的TXT或者DOC,而是PDF格式的。 而用R语言抓取PDF中的中文文本又是一件非常轻松的工作,只需要几步即可。首先安装并加载包pdftoolsinstall.packages("pdftools")library(pdftoo...原创 2018-12-31 15:06:05 · 9263 阅读 · 2 评论 -
6行R语言代码搞定词云
词云效果非常非常炫酷,但是我们知道用python做词云相对比较痛苦,你需要不断在python2.7和3.6之间切换,不过R语言就方便多了,他的安装包管理相对比较舒服,用来做分词和词云只需要几行代码而已。一、准备工作目前网上的主流教程中都介绍使用Rwordseg+wordcloud的方式来做,不过R中的分词工具,最好用的还是jiebaR,安装以下三个包,这里我们介绍使用jiebaR+...原创 2018-12-30 18:43:37 · 3677 阅读 · 2 评论 -
《权游》第八季震撼开播,10行代码动态展示其中的爱恨情仇
笔者是《权力的游戏》忠实粉丝,而随着第八季的开播,我相信整部剧也将迎来高潮,人类要跟亡者军团进行交战了,到底是亡者军队击溃人类,还是人类打败亡者军队呢?王座到底会花落谁家?让我们用R语言来研究一下其中的奥秘。 下载、处理人物关系数据 首先我...原创 2019-11-10 11:47:11 · 7851 阅读 · 16 评论