自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

jiabiao1602的专栏

专注于数据分析与挖掘、R语言、大数据领域

  • 博客(62)
  • 收藏
  • 关注

原创 展示如何用R处理稀疏矩阵和利用GLMNET包

展示如何用R处理稀疏矩阵和利用GLMNET包

2014-12-30 16:51:21 11302

原创 R语言:利用相关性分析对复杂数据进行数据探索

R语言:利用相关性分析对复杂数据进行数据探索

2014-12-30 13:17:54 10911 1

原创 用R语言将数据转换成Format Vowpal Wabbit Input Files

用R语言将数据转换成 Vowpal Wabbit Format

2014-12-30 10:49:56 1665

原创 R语言:利用caret包中的dummyVars函数进行虚拟变量处理

R语言:利用caret包中的dummyVars函数进行虚拟变量处理dummyVars函数:dummyVars creates a full set of dummy variables (i.e. less than full rank parameterization----建立一套完整的虚拟变量

2014-12-29 11:29:41 13353 1

原创 R 语言 kmens聚类

数据源:在以下链接下载酒类化学成分数据,分为红酒,白酒两种数据文件,红酒和白酒在化学成分上有较明显的差异http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/分析过程:# 1)先将两组数据混合为一组# 导入数据源redwhite# 增加新字段type,1-红酒,2-白酒

2014-12-26 14:05:46 2092

原创 R中实现bagging和adaboost的包

R中的adabag包均有函数实现bagging和adaboost的分类建模(另外,ipred包中的bagging()函数可以实现bagging回归)。第一题就利用adabag包实现bagging和adaboost建模,并根据预测结果选择最优模型。a)      为了描述这两种方式,先利用全部数据建立模型:利用boosting()(原来的adaboost.M1()函数)建立adaboost分

2014-12-26 13:15:03 13068

原创 用rpart包建立regression tree,并利用prune函数进行修剪

body fat data is in TH.datalibrary(TH.data)library(rpart)data("bodyfat", package = "TH.data")help("bodyfat",package="TH.data")## starting httpd help server ... done# head(bodyfat)use

2014-12-24 17:45:36 7635

转载 If you are into large data and work a lot with package ff

http://www.bnosac.be/index.php/blog/22-if-you-are-into-large-data-and-work-a-lot-package-ffIf you are into large data and work a lot with package ffDetails Published on Wednesd

2014-12-24 00:05:21 1000

转载 Multidimensional Scaling (MDS)

http://www.rdatamining.com/examples/multidimensional-scalingMultidimensional Scaling (MDS)This page shows Multidimensional Scaling (MDS) with R. It demonstrates with an example

2014-12-24 00:02:07 1247

转载 Social Network Analysis

http://www.rdatamining.com/examples/social-network-analysisSocial Network AnalysisThis post presents an example of social network analysis with R using package igraph. The

2014-12-24 00:01:32 2034

转载 Text Mining

http://www.rdatamining.com/examples/text-miningText MiningThis page shows an example on text mining of Twitter data with R packages twitteR, tm and wordcloud. Package twitteR

2014-12-24 00:00:12 1792

转载 Association Rules

http://www.rdatamining.com/examples/association-rulesAssociation RulesThis page shows an example of association rule mining with R. It demonstrates association rule mining, pruni

2014-12-23 23:59:37 1394

转载 Time Series Clustering and Classification

http://www.rdatamining.com/examples/time-series-clustering-classificationTime Series Clustering and ClassificationThis page shows R code examples on time series clustering and classifi

2014-12-23 23:58:07 1988

转载 Time Series Analysis

http://www.rdatamining.com/examples/time-series-analysisTime Series AnalysisThis page shows examples on time series decomposition and forecasting with R.Time Series Dec

2014-12-23 23:57:26 1056

转载 Time Series Forecasting

http://www.rdatamining.com/examples/time-series-forecastingTime Series Forecasting-- Currency Exchange Rate Forecasting with ARIMA and STLThis example shows time seri

2014-12-23 23:56:40 1486

转载 Outlier Detection

http://www.rdatamining.com/examples/outlier-detectionOutlier DetectionThis page shows an example on outlier detection with the LOF (Local Outlier Factor) algorithm.The LOF algo

2014-12-23 23:55:02 2373

转载 Hierarchical Clustering

http://www.rdatamining.com/examples/hierarchical-clusteringHierarchical ClusteringThis page demonstrates hierarchical clustering with R.Draw a sample of 40 records from iri

2014-12-23 23:54:03 1101

转载 k-means Clustering

http://www.rdatamining.com/examples/kmeans-clusteringk-means ClusteringThis page demonstrates k-means clustering with R.> newiris > newiris$Species Apply kmeans

2014-12-23 23:53:16 862

转载 Decision Trees

http://www.rdatamining.com/examples/decision-treeDecision TreesThis page shows how to build a decision tree with R.> library("party")> str(iris)'data.frame':   15

2014-12-23 23:52:10 735

转载 Data Exploration

http://www.rdatamining.com/examples/explorationData ExplorationThis page shows a basic exploration of iris data with R.Check the dimensionality> dim(iris)[1] 150   5

2014-12-23 23:50:48 1042

转载 R and Hadoop Data Analysis – RHadoop

R and Hadoop Data Analysis – RHadoopPosted on February 25, 2013      15 VotesIntroductionR is a programming language and a software suite us

2014-12-23 23:45:22 1463

转载 Step-by-Step Guide to Setting Up an R-Hadoop System

Step-by-Step Guide to Setting Up an R-Hadoop System30 May 2014This is a step-by-step guide to setting up an R-Hadoop system. I have tested it both on a single computer and on a

2014-12-23 23:42:01 1183

转载 Fetch data from HBASE database from R using rhbase package

Sometimes you may have to perform some analysis on the dataset which is stored in HBASE tables on the Hadoop cluster. Recently, I came across this situation and Revolution Analytics’s packagerhbase ca

2014-12-23 17:28:38 935

转载 Ubuntu技巧之"xxx is not in the sudoers file"解决方法

原文地址:http://www.linuxidc.com/Linux/2010-12/30386.htm       用sudo时提示"xxx is not in the sudoers file. This incident will be reported.其中XXX是你的用户名,也就是你的用户名没有权限使用sudo,我们只要修改一下/etc/sudoers文件就行了。

2014-12-23 15:01:36 509

转载 Ubuntu上搭建Hadoop环境(单机模式+伪分布模式)

原文地址:http://blog.csdn.net/hitwengqi/article/details/8008203最近一直在自学Hadoop,今天花点时间搭建一个开发环境,并整理成文。首先要了解一下Hadoop的运行模式:单机模式(standalone)       单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装

2014-12-23 09:15:56 513

转载 ubuntu安装GTK+的三种方法

原文地址:http://blog.sina.com.cn/s/blog_5e756dfc01016zkd.html1 安装命令:sudo apt-get install gnome-core-develsudo apt-get install libglib2.0-doc libgtk2.0-docsudo apt-get install devhelpsudo apt

2014-12-23 09:07:30 789

转载 ubuntu 安装 rJava 出错解决方案

Hi I'm having issues with the rJava package from cran.I have installedsudo apt-get install openjdk-7-jdksudo apt-get install r-cran-rjavaand ransudo R CMD javareconf# Java interpreter : /usr

2014-12-22 10:06:59 2433

转载 R语言中的机器学习包

Machine Learning & Statistical Learning (机器学习 & 统计学习) 网址:http://cran.r-project.org/web/views/MachineLearning.html维护人员:Torsten Hothorn 版本:2008-02-18 18:19:21 翻译:R-fox, 2008-03-18 机器学习是计算机科学

2014-12-21 20:17:41 965

转载 Ubuntu下安装JDK1.6

1、下载JDK1.6,你可以到官网去下载,下载时请看清自己的系统版本,记得一定要下载相应的版本。  http://www.oracle.com/technetwork/java/javasebusiness/downloads/java-archive-downloads-javase6-419409.html#jdk-6u41-oth-JPR2、将下载的文件放置到/usr/lib

2014-12-19 22:50:15 518

转载 Ubuntu 10.10下简单安装配置R环境

向 /etc/apt/sources.list 中加入:deb http://ftp.ctex.org/mirrors/CRAN/bin/linux/Ubuntu maverick/Secure aptThe Ubuntu archives on CRAN are signed with the key of "Michael Rutter " with key ID E0

2014-12-19 19:48:50 1127

转载 ubuntu开启SSH服务,并允许ROOT权限远程登录。

原文地址:http://www.cnblogs.com/lancode/p/3953253.htmlubuntu开启SSH服务,并允许ROOT权限远程登录。 服务器配完ubuntu系统以及LNMP环境以后,想用WINSCP远程登录,就需要开启SSH服务才能支持。 SSH服务分为客户端和服务器。顾名思义,我想用WINSCP远程登录Ubuntu服务器,所以需要安装S

2014-12-19 13:18:13 16731

转载 shinyApps.io 的使用

地址:http://mooc.guokr.com/note/12791/首先,登录到 www.shinyApps.io/coussera创建用户,大家已经有了github的账户了,就可以直接使用github来注册。之后会提示你安装相关的包 shinyapps第一步,install.package('devtools'),并重启session。建议除此之外

2014-12-18 21:55:41 3604

转载 Ubuntu Server安装R和Rstudio

转自:http://www.jianshu.com/p/2c739a25d20bR是一个在科研领域很常用的工具,经常用R的年轻人或者经常上统计之都的肯定知道Rstudio的存在。然而对于R和Rstudio来讲,还是有很多问题存在的,今天我就结合我上一次在Ubuntu server上面安装R和Rstudio的经历来讲讲有些什么问题(很难Google到!)。首先是要安装R:#添加源

2014-12-18 16:36:51 1082

转载 rJava安装及Java调取R注意事项

原文地址:http://blog.csdn.net/howardge/article/details/388538671 语言简介R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。

2014-12-17 17:09:39 2111

转载 R如何查看各函数的源代码

原文地址:http://blog.163.com/jiangfeng_data/blog/static/20641403820125795819567/作为一个开源软件,R的一个非常大的优点就是我们可以随意查看所有算法的源代码,在对这些源代码进行分析的过程中不仅可以加深对算法的认识,而且可以大步提高对R语言的掌握程度。所以接下来我重点写点关于各统计方法的R语言源代码的解释。今天先对如何查看

2014-12-15 09:48:23 1097

原创 R语言编程结构-循环结构

R语言编程结构1 控制语句1.1 循环语句xfor(n in x) print(n^2)## [1] 25## [1] 144## [1] 169iwhile(ii## [1] 13iwhile(TRUE){#similar loop to above  i  if(i>10) break}i## [1

2014-12-14 22:42:46 4421

转载 jiebaR中文分词 —— R的灵活,C的效率

原文地址:http://my.oschina.net/outqin/blog/343653R是什么?记得刚接触R的时候,有一种莫名的抵触,A、B、C、D、E那么多种语言了,为什么又多冒出来一个R?为了时间序列的课程,我又要多记忆一大堆乱七八糟的语法。当发现居然有dd 23333->ee 这样的语法时,更瞬间奠定了R语言在我心中的逗比地位。因为老师没有专门教授R的相关细节,毕

2014-12-12 09:50:03 1046

转载 R语言矩阵运算

本文引用地址:http://blog.sciencenet.cn/home.php?mod=space&uid=443073&do=blog&id=321347主要包括以下内容:创建矩阵向量;矩阵加减,乘积;矩阵的逆;行列式的值;特征值与特征向量;QR分解;奇异值分解;广义逆;backsolve与fowardsolve函数;取矩阵的上下三角元素;向量化算子等.1 创

2014-12-11 09:54:48 1211

转载 数据挖掘案例:建立客户流失模型

本文转自:http://www.ciotimes.com/bi/sjwj/59200.html随着市场竞争的加剧,中国电信面临的压力越来越大,客户流失也日益增大。从统计数据看,今年固话小灵通的销户数已经超过了开户数。面对如此严峻的市场形式,当务之急就是要尽全力减少客户的流失。因此,利用数据挖掘方法,建立一套可以及时预测客户流失率的模型就相当有必要。(一)确定客户流失模型的目标:

2014-12-11 09:53:28 1928 1

转载 R数据分析当中的化整为零(Split-Apply-Combine)策略

来自: 糗世界本文心得自:The Split-Apply-Combine Strategy for Data Analysis, Hadley Wickham, Journal of Statistical Software, April 2011, V.40.引子:我们常常会遇到这样的问题,数据量很大,并不需要依顺序来依次处理。合理分块处理,并最终整合起来是一个不错的

2014-12-11 09:48:44 974

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除