数据分析
文章平均质量分 74
DawnJobs
数风流人物,还看今朝。
展开
-
用R进行微博分析的初步尝试
新浪微博如火如荼,基于微博的各种应用也层出不穷。有一种共识似乎是:微博数据蕴含着丰富的信息,加以适当的挖掘,能够实现众多商业应用。恰好社会网络分析也是我之前有所了解并持续学习的一个领域,因此我做了微博数据分析方面的一些尝试。这些尝试是比较初步的,属于探索性的阶段,当然不能跟微博分析家这样比较成熟的应用相提并论。并且我的分析基本上都出于想当然的直觉感受,没有具体的理论支撑,这方面需要试着找点书籍来阅原创 2014-10-09 21:43:32 · 2015 阅读 · 0 评论 -
R语言中的数据列表
1、创建列表demo_1 2、创建数据框demo_1_1 ·列表对每个列显示都会单独以一行的形式存在;·数据框则是以表(或者是矩阵)的形式显示;所以根据数据输出的格式可以判断是列表还是数据框;创建一个示例列Demo_2<-list(name=c('lucy','alice','lei'), heigh=c(178,156,188)原创 2014-10-09 21:52:05 · 3668 阅读 · 0 评论 -
R包介绍
R语言的使用,很大程度上是借助各种各样的R包的辅助,从某种程度上讲,R包就是针对于R的插件,不同的插件满足不同的需求,截至2013年3月6日,CRAN已经收录了各类包4338个。 一、 R语言包的安装1、通过选择菜单:程序包->安装程序包->在弹出的对话框中,选择你要安装的包,然后确定。2、使用命令install.packages("pack原创 2014-10-09 21:53:19 · 2186 阅读 · 0 评论 -
R数据结构—矩阵
矩阵的创建在R中用函数matrix()来创建一个矩阵,使用该函数时需要输入必要的参数值。matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE,dimnames = NULL)1. data向量元素列表2. nrow行数3. ncol列数4. byrow 矩阵是按列优先的原创 2014-10-09 21:55:44 · 1085 阅读 · 0 评论 -
R语言数据结构-数据框
数据框(data frame) 数据框是一种矩阵形式的数据,但数据框中各列可以是不同类型的数据。数据框每列是一个变量,每行是一个观测。数据框可以看成是矩阵的推广,也可看作一种特殊的列表对象,很多高级统计函数都会用到数据框。数据框用函数data.frame()生成,语法是:data.frame(data1, data2, ...)1、生成一个数据框例1:name原创 2014-10-09 21:59:21 · 1743 阅读 · 0 评论 -
R语言基础-因子和有序因子
因子(factor)和有序因子(ordered factor)因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。因子表示分类变量,有序因子表示有序变量。生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因原创 2014-10-09 22:00:43 · 4329 阅读 · 0 评论 -
用R语言实现简单的线性回归
用R语言进行简单线性回归分析,数据出自何晓群--应用回归分析,语言如下所示:x y3.4 26.21.8 17.84.6 31.32.3 23.13.1 27.55.5 360.7 14.13 22.32.6 19.64.3 31.32.1 241.1 17.36.1 43.24原创 2014-10-09 22:01:14 · 5916 阅读 · 0 评论 -
用R语言求置信区间
用R语言求置信区间是很方便的,而且很灵活,至少我觉得比spss好多了。如果你要求的只是95%的置信度的话,那么用一个很简单的命令就可以实现了首先,输入da=c(你的数据,用英文逗号分割),然后t.test(da),运行就能得到结果了。我的数据是newbomb t.test(newbomb)得到的结果如下 如果要求任意置信度下的置信区间的话,就需要自己原创 2014-10-09 22:04:27 · 66437 阅读 · 0 评论 -
Google和facebook如何应用R进行数据挖掘
在R用户组织的主题为“R与预测分析科学”的panel会议上,有来自工业界的四位代表发表了讲话,介绍各自在工业界是如何应用R进行数据挖掘。他们分别是:Bo Cowgill, GoogleItamar Rosenn, FacebookDavid Smith, Revolution ComputingJim Porzak, The Generations Network原创 2014-10-09 22:06:02 · 749 阅读 · 0 评论 -
用R软件绘制中国分省市地图
【注】新版本的maptools包对很多函数进行了修改,对于修改的内容,文章中用红色的文字进行了说明。 鉴于最近有不少人在讨论用R软件绘制地图的问题,我也就跟着凑了凑热闹,对相应的方法学习了一番。下面的这篇文章是一个初步的介绍,还有很多内容仍在学习和探索中,如果大家有什么意见或建议,我将根据自己学习的情况对文章进行进一步的补充。 在R中绘制地图其实是十分方转载 2014-10-09 22:08:32 · 6536 阅读 · 2 评论 -
R语言入门基础教程:常用运算函数
R语言入门基础教程:常用运算函数。对一般数据进行运算的常用函数:1、round() #四舍五入例:x round(x, 0) #保留整数位round(x, 2) #保留两位小数round(x, -1) #保留到十位 2、signif() #取有效数字(跟学过的有效数字不是一个意思)例:略 3、trunc() #取整原创 2014-10-09 22:08:44 · 1560 阅读 · 0 评论 -
R语言中的数据结构——向量
R语言中的图一 R语言的数据对象类型简介图在本系列文章中,接下将分别介绍R语言的几种数据对象:向量、矩阵、数据框与列表、其它特殊对象;请大家在学习R语言的时候永远记住一个概念,R语言所有内容都是对象;一、向量基本概念R语言中最为核心的构成之一 1、向量构成的基本元素为:数值(numeric)、字符(character)、逻辑值(logical)、复数原创 2014-10-09 21:54:24 · 3322 阅读 · 0 评论 -
R语言基础-数组和列表
数组(array)一维数据是向量,二维数据是矩阵,数组是向量和矩阵的直接推广,是由三维或三维以上的数据构成的.数组函数是array(),语法是:array(dadta, dim),其中data必须是同一类型的数据,dim是各维的长度组成的向量。1、产生一个三维和四维数组。例1:xx 例2:yy 2、dim()函数可将向量转化成数组或矩阵。原创 2014-10-09 21:59:54 · 3471 阅读 · 0 评论 -
R语言与机器学习学习笔记(分类算法)
人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模,或用来探索数据的模式。人工神经网络从以下四个方面去模拟人的智能行为: 物理转载 2014-10-09 22:07:51 · 2893 阅读 · 0 评论 -
R的数据分析制霸以及企业级应用盘点
随着大数据被更多的企业采用,大数据分析算法编写和生产语言也得到了广泛的关注。而在不知不觉中,开源统计语言R已基本成为大数据科学家和开发者的必备技能。在所有编程语言和技巧中,人气急剧上升。以下为译文 通过与大数据工具整合,R提供了大数据集的深度统计能力,包括统计分析以及数据驱动的可视化等。而在金融、药物、媒体及销售这些可直接从数据中获取决策的行业中,R更得到转载 2014-10-09 22:12:25 · 805 阅读 · 0 评论 -
R语言简介
R语言是由 Ross Ihaka、Robert Gentleman二位创建的,这也许可以解释为什么叫R语言。现在由“R开发核心团队”负责开发。R是基于S语言的一个GNU项目。一、R语言介绍 R是为统计计算和作图的一门语言和环境。是一个GNU项目,和S语言和环境很相似,S语言是由BELL实验室的John Chambers和他的同事开发的。R语言可以认为是从S语言衍生而原创 2014-10-09 21:51:56 · 1529 阅读 · 0 评论 -
R语言学习由浅入深路线图
现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言。对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是——看书。目前,市面上介绍R语言的书籍很多,中文英文都有。那么,众多书籍中,一个生手原创 2014-10-09 22:07:45 · 1009 阅读 · 0 评论 -
马恩驰:R向量化运算
一、背景当今社会,数据量剧增让我们越来越关注计算或算法的效率。“并行和分布式”计算是目前主流的能有效提升计算效率的方法,但学习及实施成本较高。所以,向量化运算对于提升计算效率是个不错的选择。作为并行计算的先驱,向量化运算在提升计算效率的同时,也能一定程度上培养数据分析人员的结构化思维。向量化计算是一种特殊的并行计算的方式,相比于一般程序在同一时间只执行一个操作的方式,它可以在同一时转载 2014-10-09 22:12:19 · 1452 阅读 · 0 评论 -
R语言中数据的输入与输出之READ函数
read.table() 函数1、用于读入表格(表)类型的数据,同时生成数据框对象。2、读入的数据要求有规则的分隔符,默认有:空格、TAB、换行符、回车符;其它的分隔符,通过sep=来进行指定。read.table(file, header = FALSE, sep = "", quote = "\"'", dec = ".", row.name原创 2014-10-09 21:48:57 · 6275 阅读 · 1 评论 -
R语言在做为数据分析工具的优点
我从事数据分析工作已经有十年之久。最初是出于工作需要,我的经理给我一堆数据,我需要处理这些数据。当时我一直使用的工具是 Excel,因为这是我熟练掌握的一款工具。三年前,我开始接触到 R,一开始因为功能太多而坚决抵制使用。后来我开始琢磨如何使用。现在我基本不怎么使用 Excel 了。这只是我个人的观点,但是如果你要分析数据,R 更胜任这项任务。下面来说说为什么 R 更适合数据分析。转载 2014-10-09 22:11:03 · 2522 阅读 · 2 评论