R
newusb
这个作者很懒,什么都没留下…
展开
-
从一个R语言案例学线性回归
线性回归简介如下图所示,如果把自变量(也叫independent variable)和因变量(也叫dependent variable)画在二维坐标上,则每条记录对应一个点。线性回规最常见的应用场景则是用一条直线去拟和已知的点,并对给定的x值预测其y值。而我们要做的就是找出一条合适的曲线,也就是找出合适的斜率及纵截矩。SSE & RMSE 上图中的SSE指sum of转载 2015-08-10 22:46:14 · 1885 阅读 · 0 评论 -
15个构建交互式图表的最佳jQuery插件
在这篇文章中,我们向你推荐 15 个图表库,包含从简单图表实现到高度复杂的交互式图表,希望你会喜欢。1. Chart.js : Charting Library with HTML5 Canvas 使用HTML5 Canvas元素的Javascript图形库,支持6种统计图形,不依赖其他库.2. xCharts : For Building Data-D转载 2015-10-12 11:19:14 · 1431 阅读 · 0 评论 -
数据可视化常用的五种方式及案例分析
概念借助于图形化的手段,清晰、快捷有效的传达与沟通信息。从用户的角度,数据可视化可以让用户快速抓住要点信息,让关键的数据点从人类的眼睛快速通往心灵深处。 数据可视化一般会具备以下几个特点:准确性、创新性 和 简洁性。常用五种可视化方法下面从最常用和实用的维度总结了如下5种数据可视化方法,让我们来一一看一下:一、面积&尺寸可视化对同一类图形(例如柱状、圆环和蜘蛛图等)的长度、转载 2015-10-12 10:53:31 · 5798 阅读 · 0 评论 -
项目稳定回报论证—大数据进入价值变现的2.0时代
移动互联网和传感器出现推动了大数据时代的出现,大量非结构化数据的出现令数据处理面临了难题,在大数据时代初期,有关大数据应用主要集中在收集数据,存储数据、处理数据等方面,解决的是主要是数据效率问题。当数据效率问题被解决之后,大数据价值变现问题将摆到面前,也就是说大数据将进入2.0时代(价值变现时代)。 一大数据1.0时代的特征 大数据1.0时代的主要特征是发现大数转载 2015-10-23 14:23:53 · 832 阅读 · 0 评论 -
R语言文本挖掘和词云可视化实践
互联网时代,大量的新闻信息、网络交互、舆情信息以文本形式存储在数据库中,如何利用数据分析和文本挖掘的算法,将海量文本的价值挖掘出来,成为我们团队近期的一个研究方向,本案例就是我们的一个初步尝试。飞信群是我们在工作、生活中交流的重要平台,在将近一年的时间里共产生了几万条的聊天记录,展现了我们这个团队的方方面面。本文将通过KNIME、R语言和tagxedo三个工具来实现文本挖掘转载 2015-09-29 11:41:09 · 3673 阅读 · 0 评论 -
简单易学多维数据可视化R实现:神奇的卡通脸谱图Chernoff faces
Chernoff face是由美国统计学家Chernoff在1976年率先提出的,用脸谱来分析多维度数据,即将P个维度的数据用人脸部位的形状或大小来表征。他首先将该方法用于聚类分析,引起了各国统计学家的极大兴趣,并对他的画法作出了改进,一些统计软件也收入了脸谱图分析法,国内也有很多研究工作者将该方法应用于多元统计分析中。脸谱图分析法的基本思想是由15-18个转载 2015-09-29 14:51:19 · 10834 阅读 · 0 评论 -
R语言词云
pinglun1=read.table("1.txt",sep="|")# == 文本预处理 res=pinglun1[pinglun1!=" "]; #剔除通用标题 res=gsub(pattern="[專賣店【未拆封順豐】||]+"," ",res); #剔除特殊词 res=gsub(pattern="[我|你|的|了|是]"," ",res);转载 2015-08-18 15:46:36 · 1518 阅读 · 0 评论 -
R语言抓取pm2.5数据绘制全国pm2.5分布图
library(rworldmap)library(XML)###Set date like yyyy-mm-ddStartDate = format(Sys.time() - 86400 ,"%Y-%m-%d")EndDate = format(Sys.time() - 86400 ,"%Y-%m-%d")Start = Sys.time()cat("Ob转载 2015-08-17 00:45:34 · 3279 阅读 · 0 评论 -
R语言系列:datasets(R自带数据包)
向量euro #欧元汇率,长度为11,每个元素都有命名landmasses #48个陆地的面积,每个都有命名precip #长度为70的命名向量rivers #北美141条河流长度state.abb #美国50个州的双字母缩写state.area #美国50个州的面积state.name #美国50个州的全称因子stat转载 2015-08-16 16:08:57 · 13894 阅读 · 0 评论 -
R概率分布函数使用小结
R中自带了很多概率分布的函数,如正太分布,二次分布,卡放分布,t分布等,这些分布的函数都有一个共性,每个分布拥有4个带有d,p,q,r前缀的函数。比如正太分布,有dnorm,pnorm,qnorm和rnorm。这几个前缀的意义如下:d Density的缩写,表示密度函数。举个例子,标准正太分布x=0对应的值可以用dnorm(0)计算p Probability的缩写,表示概率函数。举转载 2015-08-30 10:00:10 · 1020 阅读 · 0 评论 -
利用R语言编写量化投资策略
选取一股票,利用R语言进行分析,同时构建通道突破,双均线交叉和MACD策略,进行回测。library(xts)library(xtsExtra)library(quantmod)library(FinTS)library(forecast)library(TSA)library(TTR)library(fGarch)library(rug转载 2015-10-27 10:39:56 · 6723 阅读 · 0 评论