自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

转载 R语言-自动批处理

R语言-自动批处理文件  在处理数据的过程中,可以制作一个自动批处理文件,让它具有智能的效果,自动化完成复杂的数据处理过程,提高工作效率,解放生产力,从而可以投入更多的精力到数据分析和数据挖掘中,发现数据中的"金子",体现数据的真正价值!!!方法1:  R语言中 C:\Program Files\R\R-3.2.0\bin\x64 中有个 Rscript....

2016-11-18 10:16:00 795

转载 R 语言7个免费的GUI图像界面工具说明 .

这7款工具的说明整理自如下网站:http://www.linuxlinks.com/article/20110306113701179/GUIsforR.htmlGraphical user interfaces for RRStudioIntegrated development environment (...

2016-11-17 20:37:00 442

转载 R语言--数据预处理

一、日期时间、字符串的处理日期Date: 日期类,年与日POSIXct: 日期时间类,精确到秒,用数字表示POSIXlt: 日期时间类,精确到秒,用列表表示Sys.date(), date(), difftime(), ISOdate(), ISOdatetime()#得到当前日期时间(d1=Sys.Date()) #日期 年月日...

2016-11-05 19:32:00 290

转载 R语言学习笔记——数据结构 & 数据框基本操作

R语言学习笔记——数据结构 & 数据框基本操作参考书籍:R语言实战数据结构:1. 向量 :用于存储数值型、字符型或逻辑型数据的一维数组  1.1创建 : a <- c(1, 2, 3, 4)  1.2访问 : a[1] : 1       a[c(2, 4)] : 2 4 (向量a中的第二个和第四个元素)       a[1...

2016-10-27 21:20:00 138

转载 R—读取数据(导入csv,txt,excel文件)

导入CSV、TXT文件read.table函数:read.table函数以数据框的格式读入数据,所以适合读取混合模式的数据,但是要求每列的数据数据类型相同。read.table读取数据非常方便,通常只需要文件路径、URL或连接对象就可以了,也接受非常丰富的参数设置:file参数:这是必须的,可以是相对路径或者绝对路径(注意:Windows下路径要用斜杠'/'或者双反斜...

2016-10-27 21:18:00 414

转载 GA算法-R语言实现

GA算法-R语言实现旅行商问题班共有30位同学,来自22个地区,我们希望在假期来一次说走就走的旅行,将所有同学的家乡走一遍。算起来,路费是一笔很大的花销,所以希望设计一个旅行方案,确保这一趟走下来的总路程最短。旅行商问题是一个经典的NP问题NP就是Non-deterministic Polynomial,即多项式复杂程度的非确定性问题,是世界七大数学难题...

2016-10-27 21:12:00 1020

转载 关联规则-R语言实现

关联规则shangfr2015年10月29日本文旨在演示r语言arules包的关联规则用法,以及利用arulesViz对结果进行可视化关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 。其中,关联规则...

2016-10-27 21:01:00 500

转载 R语言-妹子被追后的选择分析

前提假设妹子们一生中可以遇到100个追求者,追求者的优秀程度符合正态分布;每个妹子都具备判断并比较追求者优秀程度的能力;接受或拒绝一个追求者后永远无法后悔。那么,问题来了当遇到追求者时,如何选择才能获得最优结果?如果人的优秀程度符合均值为80,方差20的正态分布,随机产生100个追求者,其优秀程度分布情况见下图:p=rnorm(100,80,20)...

2016-10-27 20:59:00 117

转载 使用R的networkD3包画可交互的网络图

d3network包http://www.cnblogs.com/shangfr/p/5417054.htmlShangFR2016年5月6日R d3network包力导向图桑基图(Sankeydiagram)Reingold-Tilford树型图反馈与建议R d3network包通过Christopher Gandru...

2016-10-27 20:56:00 565

转载 用R进行市场调查和消费者感知分析

问题到数据理解问题理解客户的问题:谁是客户(某航空公司)?交流,交流,交流!问题要具体 某航空公司: 乘客体验如何?哪方面需要提高? 类别:比较、描述、聚类,判别还是回归 需要什么样的数据:现有数据,数据质量,需要收集的数据,自变量,因变量 哪些方面的满意度?哪些主要竞争对手? 内部数据?外部数据?领导不关心的问题都是没有未来...

2016-10-27 20:36:00 939

转载 R语言XML格式数据导入与处理

数据解析XML是一种可扩展标记语言,它被设计用来传输和存储数据。XML是各种应用程序之间进行数据传输的最常用的工具。它与Access,Oracle和SQL Server等数据库不同,数据库提供了更强有力的数据存储和分析能力,例如:数据索引、排序、查找、相关一致性等,它仅仅是存储数据。事实上它与其他数据表现形式最大的不同是:它极其简单,这是一个看上去有点琐细的优点,但正是这点使它与...

2016-10-27 20:33:00 601

转载 R爬取网页信息

#爬取电影票房信息library(stringr)library(XML)library(maps)#htmlParse()用来interpreting HTML#创建一个objectmovie_parsed<-htmlParse("http://58921.com/boxoffice/wangpiao/20161004", ...

2016-10-27 20:26:00 142

转载 设置R启动时自动加载常用的包或函数

在文章(http://www.cnblogs.com/homewch/p/5749850.html)中有提到R可以自定义启动环境,需要修改R安装文件中的ect文件夹下的配置文件Rprofile.site即可:Rprofile.site文件里,设置的内容包括默认编辑器,CRAN镜像选取,自动加载包等等。如果你想要将常用的package和function在启动的时候让R自动加载,...

2016-10-27 20:17:00 1404

转载 在Hadoop集群上运行R程序--安装RHadoop

RHadoop是由Revolution Analytics发起的一个开源项目,它可以将统计语言R与Hadoop结合起来。目前该项目包括三个R packages,分别为支持用R来编写MapReduce应用的rmr、用于R语言访问HDFS的rhdfs以及用于R语言访问HBASE的rhbase。下载网址为https://github.com/RevolutionAnalytics/RHadoo...

2016-10-25 21:45:00 231

转载 R中的普通文本处理-汇总

介绍:1. 文本文件的读写 2. 字符统计和字符翻译3. 字符串连接4. 字符串拆分5. 字符串查询6. 字符串替换7. 字符串提取说明:普通文本文件不同于我们平时接触到的表格式文本文件,这里的文本文件是纯文本文件,里面包含的大部分都是字符串;而表格式文本文件大多是行列比较整齐的数据文件,读取这一类的文件,需要用到read.table()或read....

2016-10-25 21:43:00 94

转载 R(六): RODBC 访问SqlServer

在我的实际工作中,数据来源一方面是关系型数据库MS SqlServer, 别一方面是HBase。本节主要介绍通过RODBC访问MS SqlServer 安装配置,参见资料(https://msdn.microsoft.com/en-us/library/hh568454(v=sql.110).aspx),请注意:下载的msodbc 的版本与 unixODBC的版本之间有强制的对应关系...

2016-10-25 21:41:00 133

转载 R(八): R分词统计-老九门

分析文本内容基本的步骤:提取文本中的词语 -> 统计词语频率 -> 词频属性可视化。词频:能反映词语在文本中的重要性,一般越重要的词语,在文本中出现的次数就会越多。词云:让词语的频率属性可视化,更加直观清晰。文本下载地址(http://www.yuandn.com/booktxt/59797/#download效果图是将老九门12章后面内容删除后结果)目录:...

2016-10-25 21:35:00 231

转载 hadoop(一):深度剖析hdfs原理

在配置hbase集群将 hdfs 挂接到其它镜像盘时,有不少困惑的地方,结合以前的资料再次学习; 大数据底层技术的三大基石起源于Google在2006年之前的三篇论文GFS、Map-Reduce、 Bigtable,其中GFS、Map-Reduce技术直接支持了Apache Hadoop项目的诞生,Bigtable催生了NoSQL这个崭新的数据库领域,由于map-Reduce处理...

2016-10-25 21:31:00 88

转载 R(三): R包原理及安装

包(package)是多个函数的集合,常作为分享代码的基本单元,代码封装成包可以方便其他用户使用。越来越多的R包正在由世界上不同的人所创建并分发,这些分发的R包,可以从CRAN 或 github 上获取,由于向 CRAN 提交包审核非常严格,有些开发者并没有将自己开发的R包提至CRAN的意向,通过 devtools 可以轻松从 github上下载安装。包的生命周期一般会经历 sour...

2016-10-25 21:29:00 239

转载 R(一): R基础知识

R 是一门拥有统计分析及作图功能的免费软件,主要用于数学建模、统计计算、数据处理、可视化等方向。据 IEEE Spectrum发布的2016年编程语言前10位排名来看,R语言由2015年排名第6位上升级2016年的第5位。目前在CRAN 上发布的算法包已经超过8000+多个。R体系涉及到高等数据、概率学、统计学、IT技术等多种知识的综合应用,虽然看起来超级复杂,但学过程还是得从基础开始。...

2016-10-25 21:28:00 1334

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除