R语言
文章平均质量分 78
肥腾君
这个作者很懒,什么都没留下…
展开
-
R语言实战第十三章
R语言实战第13章广义线性模型在普通的回归分析中,因许多因变量的假设都符合.假设因变量不符合正太分布或不符合连续型变量,如以下几种情况:(1):结果变量可能是类别型的,例如二值变量.(2):结果变量是计数型的,此类变量是肺腑的有限制,且均值与方差通常是相关的.广义线性模型拓展了线性模型的框架,包含了非正态因变量的分析.采用了glm()函数,采用的模型为logistic模型和原创 2017-05-21 22:05:12 · 3289 阅读 · 0 评论 -
R语言实战第十四
1. 前言主成分分析是一种数据降维的技巧,能将大量相关变量转化为一组很少的不想管变量,这些不相关变量称之为主成分,因子分析是一系列用来发现一组变量的潜在结构的方法,通过寻找一组更小的,潜在的结构解释观测到的,显式的变量间的关系.主成分分析是观测变量的线性组合,形成线性组合的全中都是通过最大化个主成分所解释的方差来获取,同时要保证各主成分各不相关.因子分析是被当做是观测变量的结构基础或原创 2017-05-24 21:34:18 · 1827 阅读 · 0 评论 -
R语言实战 聚类分析
16.聚类分析1.前言聚类分析是一种数据规约技术,在与揭露一个数据集中观测值的子集,可以把大量的观测值规约为若干个类,而类即是被定义为若干个观测值组成的群组,组内相似度高于组间相似度,即是聚类.最常用的聚类时层次聚类和划分聚类。层次聚类即是每个观测值自成一类,这些类再两两合并,直到最后只剩下一类。常用的算法有单联动算法,全联动算法,平均联动、质心和word方法。划分聚类是制定类的K原创 2017-06-03 09:21:23 · 10662 阅读 · 0 评论 -
R绘制股票走势图及年份成交量图
目的:抓取雅虎网站上的还有Oracle公司的股票价格,绘制最高最低点,及描述其年成交量的比例可以通过getSymbols函数抓取在雅虎上的股票数据,事先需要先下载好两个关于股票的包:library(quantmod)library(tseries)getSymbols("ORCL",src="yahoo")输入对应的股票名称,就能得到股票数据,eg:ORCL:原创 2017-07-11 15:23:11 · 2178 阅读 · 0 评论 -
R语言时间数据
R语言关于时间数据将字符串等数据转化为时间类型的数据,在R中的基本函数有as.POSIXlt和as.POSIXct()使用范例:as.POSIXct("2017/06/11 00:33:20")[1] "2017-06-11 00:33:20 CST"as.POSIXct("10:30:30 2010/01/01",format="%H:%M:%s %Y/%m/%d")[1原创 2017-06-13 01:28:18 · 1572 阅读 · 0 评论 -
R爬取新浪财经网的股票数据
使用到的包是RCurl,通过这个包可以做一些网页讯息的抓取先通过新浪财经的入口,选一只感兴趣的股票,再点击左边行情走势下的历史交易得到历史交易数据常用的浏览器可以打开网页讯息的源代码:首先读取包并用,读取该网址的信息,并按行对信息进行切割:library(RCurl)temp<-getURL(url)k=strsplit(temp,"\r\n")[[1]]原创 2017-07-20 09:29:37 · 3827 阅读 · 0 评论