R learning
blacklee123
先思考再行动
展开
-
R Data Management(数据管理)
摘要: 本部分以R的视角来描述获取数据之后,进行数据处理的形式。这包括创建新的变量(包括重新编码和重命名已经存在的变量)、排序和合并数据集、聚集数据、重塑数据、对数据集取子集(包括选择符合条件的观测、随机抽取观 ...一旦你获取数据之后,你一定想把数据处理成有用的形式。这包括创建新的变量(包括重新编码和重命名已经存在的变量)、排序和合并数据集、聚集数据、重塑数据、对转载 2014-01-10 18:32:11 · 960 阅读 · 0 评论 -
关联规则的R语言实现
文章参考资料:xccd:肖凯大牛的博文《Rdatamining》《R IN A NUTSHELL》注:如有疑惑的问题,参阅下文的预备知识!关联分析的挖掘任务可分解为两个步骤:一是发现频繁项集,二是从频繁项集中产生规则。############################ 关联分析 案例实践 ##############转载 2014-04-28 21:51:31 · 2912 阅读 · 0 评论 -
caret包处理流程
caret包可以处理至少以下事情.1、初步筛选属性(过滤以下属性)a、找出 属性值接近为常数的 属性 nearZeroVarb、找出 相关系数最大的 属性 findCorrelationc、找出 多重共线性的 属性 findLinearCombos2、处理缺失值 preProcess(data, method=c("bagImput转载 2014-04-28 21:55:16 · 1422 阅读 · 0 评论 -
R语言多元分析系列汇总
R语言多元分析系列之一:主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分转载 2014-04-08 17:13:05 · 5961 阅读 · 0 评论 -
R语言实现Google 搜索引擎的pagerank算法
PageRank算法R语言实现算法为王系列文章,涵盖了计算机算法,数据挖掘(机器学习)算法,统计算法,金融算法等的多种跨学科算法组合。在大数据时代的背景下,算法已经成为了金字塔顶的明星。一个好的算法可以创造一个伟大帝国,就像Google。算法为王的时代正式到来….关于作者:张丹(Conan), 程序员Java,R,PHP,Javascriptweibo:@Conan转载 2014-03-03 16:56:04 · 2017 阅读 · 1 评论 -
常用连续型分布介绍及R语言实现
R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。要成为有理想的极客,我们不能停留在语法上,要转载 2014-03-03 18:28:27 · 2259 阅读 · 0 评论 -
概率基础和R语言
转载:http://blog.fens.me/r-probability/R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知转载 2014-03-03 18:26:56 · 2591 阅读 · 0 评论 -
apply lapply sapply等R函数
转载出处:http://www.ats.ucla.edu/stat/r/library/advanced_function_r.htmR Library: Advanced functionsThe R program (as a text file) for the code on this page.In order to see more than just the转载 2014-03-03 15:14:55 · 1319 阅读 · 0 评论 -
处理芯片cel格式数据的全自动R代码
>source(”http://bioconductor.org/biocLite.R”)>biocLite()全自动。只需要设置工作路径以及filelist.txt文件即可。filelist.txt,必须与CEL文件一起放置在工作目录内,文件以空格为间隔,分两列,分别是filename和factor 例filename factorMS1_(Mouse430_转载 2014-01-10 21:18:48 · 9760 阅读 · 0 评论 -
R中的距离与聚类
摘要: 聚类是建模的起点,在没有目标的前提下,对研究对象按照距离分为不用的组。组内的距离尽可能小,组间距离尽可能大;最常用的两种聚类方法是系统聚类和k-means。简介:聚类是建模的起点,在没有目标的前提下,对研究对象按照距离分为不用的组。组内的距离尽可能小,组间距离尽可能大;最常用的两种聚类方法是系统聚类和k-means;系统聚类是转载 2014-01-10 21:05:16 · 2084 阅读 · 0 评论 -
电影爱好者的R函数
摘要: 作为一个伪影迷,经常纠结一些电影该不该下,要不要看。毕竟吾生也有涯而片源无涯。还好可以去豆瓣一类的地方看看大家的评分择优录用。作为一个伪影迷,经常纠结一些电影该不该下,要不要看。毕竟吾生也有涯而片源无涯。还好可以去豆瓣一类的地方看看大家的评分择优录用。去豆瓣查分需 要登录网站搜索再鼠标点点点,如果要查好几部电影就有点费事儿。其实可以用R写个函转载 2014-01-10 21:03:50 · 1007 阅读 · 0 评论 -
R中的极大似然估计
摘要: 1. 数据与模型 我们要使用的数据来自于“MASS”包中的geyser数据。先把数据调出来,看看它长什么样子。 geyser waiting duration 1 80 4.0166667 2 71 2.1500000 3 57 4.0000000 4 80 4.0000000 5 75 4.0000000 … ...1. 数据与模型转载 2014-01-10 21:01:27 · 13020 阅读 · 2 评论 -
R foundmental
摘要: 与SAS不同的是,SAS有数据步和过程步,而R拥有诸多的数据结构(向量,矩阵,数组,数据框),通过函数在这些数据结构上进行统计分析和创建图形。在这一点上,R与SAS的PROC IML过程步很相似。 与SAS不同的是,SAS有数据步和过程步,而R拥有诸多的数据结构(向量,矩阵,数组,数据框),通过函数在这些数据结构上进行统计分析和创建图形。在这一点上,R与转载 2014-01-10 17:21:53 · 1232 阅读 · 0 评论 -
R Interface(R界面)
摘要: R是S语言的一种实现。它是一种大小写敏感的解释型语言。你可以在命令提示符(>)后面直接一句一句输入要执行的命令,也可以通过运行一个源文件来执行一系列命令。R的数据类型很多,包括向量(数值型向量、文字型向量 ...1.概况R是S语言的一种实现。它是一种大小写敏感的解释型语言。你可以在命令提示符(>)后面直接一句一句输入要执行的命令,也可以通过运行一个源文件转载 2014-01-10 17:51:03 · 947 阅读 · 0 评论 -
R 实现朴素贝叶斯算法
摘要: 朴素贝叶斯分类算法是一种常用的分类方法,应用非常广泛,譬如垃圾邮件判断,电子商务反作弊(作弊卖家等等)。 # 数据集来自Tom Mitchell's book "Machine Learning". #定义数据矩阵matrix,matrix(vector, nro ...朴素贝叶斯分类算法是一种常用的分类方法,应用非常广泛,譬如垃圾邮转载 2014-01-10 18:06:29 · 1689 阅读 · 0 评论 -
R语言实现--分类法在医学诊断中的应用
1.引言随着统计科学的日益发展,其对其他学科的渗透作用日益增强,数据分析方法在医学、生物学、社会学等各个学科中得到了广泛的应用,本文试图对收集到的某个临床医学数据运用决策树、神经网络、支持向量机、随机森林等各种现代分类方法进行分析,以佐证数据挖掘对其他学科的重要意义;另一方面,就各种现代分类方法的实际效果进行对比。笔者从网上收集到关于某个脊椎病变的临床医学数据,该数据集为真实公开的非人造数转载 2014-01-10 17:19:40 · 3655 阅读 · 1 评论 -
开源学习 Rweka
今天在找关联规则相关的资料时候,无意发现R语言中文论坛,虽然里面的资料有限,但是很有价值,譬如RWeka,一种开源的机器学习工具,在此予以介绍:背景介绍: #此前在首页部分显示#1)Weka:Weka有两种意思:一种不会飞的鸟的名字,一个机器学习开源项目的简称(Waikato Environment for Knowledge Analysis,http://www.cs.waikat转载 2014-06-19 13:19:04 · 946 阅读 · 0 评论