R读书笔记
文章平均质量分 50
houjing1990
对外宣传:蓝翔技校挖掘机专业出身,苦练挖掘技术多年,值得信赖
展开
-
R编程艺术读书笔记(5-6章)
学习和使用R已经有1年多的时间了,看了很多R教程视频,看了很多电子书,买了几本R相关的书,现觉得编程思维很重要,所以继续钻研R编程艺术,已读到第五章,希望读完整本书可以帮助自己R达到大成的状态。R语言编程艺术:第五章drop=F表示向量变成数据框的参数条件。complete.cases()用法跟na.rm和na.omit有点相似,但可以精确删除某行或某列。用法是:x【complete原创 2017-04-17 15:00:23 · 739 阅读 · 2 评论 -
R语言与网站分析 第8章样本分…
第八章:样本细分8.1数据降维因子载荷(loading):定义:第8章样本分析:聚类分析" TITLE="R语言与网站分析 第8章样本分析:聚类分析" />第8章样本分析:聚类分析" TITLE="R语言与网站分析 第8章样本分析:聚类分析" />5.特征值和信息损失率 P2966.因子得分:计算好因子载荷A和特殊因子e后,计算因子F的数据。计算方式有:加权最小二乘法(Bartle原创 2017-04-17 15:01:46 · 1647 阅读 · 1 评论 -
R语言与网站分析 第7章分类指…
7章分类指标建模:分类分析 决策树分裂 第7章分类指标建模:分类分析" TITLE="R语言与网站分析 第7章分类指标建模:分类分析" />信息增益:信息熵;信息增益gain(X)=info(S)-info1(S)=熵-条件熵CART算法:二分支,Gini系数 C4.5:多分支,连续/离散变量,信息增益比率(info gain ratio) C4.5如何原创 2017-04-17 15:01:42 · 2265 阅读 · 0 评论 -
R常用函数知识点
make.groups:实现几个相似的对象(向量或数据框)合并为一个数据框。汇总函数:tapply,aggregate函数 tapply(x,INDEX,FUN=,...,simplify=)用于向量的分组汇总分析,INDEX是因子列表;by函数雷同(数据框) aggregate(x,by,FUN,...)boxplot函数查看是否有异常值,然后用boxplot.stats原创 2017-04-17 15:01:37 · 376 阅读 · 0 评论 -
R语言经典实例 12-13章
12章有用的方法rowSums行的和colSums列的和对数据分组 f找到特定值的位置,match函数,最大值which.maxseq_along和seq_len总是返回一个整数向量每隔n个选定一个向量元素:v[seq_along(v)%%n==0]平行最小值:pmin(1:5,5:1)输出结果是1 2 3 2 1平行最大值:pmax(1:5,5:1)输出结果是5 4 3 4 5原创 2017-04-17 15:01:33 · 1416 阅读 · 0 评论 -
R语言经典实例 11章方差分析…
R语言经典实例11章方差分析:ANOVAmanova(m)给出方差分析表coefficients(m)给出模型系数coef(m)同上confint(m)给出回归系数的置信区间deviance(m)给出残差平方和effects(m)给出正交影响向量fitted(m)给出拟合y值的向量residuals(m)给出模型残差resid(m)同上vcov(m)主要参数的方差--协方差原创 2017-04-17 15:01:28 · 7309 阅读 · 0 评论 -
R语言回归篇
原文地址:R语言回归篇作者:霁得彩虹 R语言回归篇分类: R2014-06-0921:48 1198人阅读 评论(0) 收藏 举报R目录(?)[+]1.回归的多面性回归类型用途简单线性个量化的解释变量来预测一个量化的响应变量(一个因变量、一个自变量)多项式一个量化的解释变量预测一个量化的响应变量,模型的关系是n阶多项式(一个预测变量转载 2017-04-17 15:01:21 · 8982 阅读 · 1 评论 -
R语言经典实例(9-10章)
R语言经典实例知识点规范化数据:scale(x) 公式:(y-mean(x))/sd(x)第九章:检验: 样本均值算总体均值:t检验:t.test(x,mu=m) mu为总体均值,p 样本比例:prop.test检验:prob.test(x,n,p) 样本量是n并且样本包含x次成功。p均值置信区间:t.test(x,conf.level=0.99) 99%的置信区间,默认95原创 2017-04-17 15:01:16 · 3051 阅读 · 0 评论 -
数据挖掘:R语言实战(抽样)
抽样: 简单随机抽样:sample(x,size,replace=F,prob=NULL),size是抽样的个数N,replace默认是无放回,prob等概率抽样。prob=1时候就是直接连续重复抽样。 分层抽样:sampling包中的strata函数,用法:strata(data,stratanames=NULL,size,method=c('srswor','srswr','原创 2017-04-17 15:01:11 · 4758 阅读 · 0 评论 -
R语言编程艺术完结版和读后感
R语言编程艺术这本书后面干货很少了,对我个人帮助不大,第十四章可以简单看看,讲的是提高代码运行效率的,其他的在日常工作中几乎没有帮助。这本书对于初学者或者中级者帮助不大,对高级R编程达人可能有一点帮助吧,还是干货太少了,和R语言实战、learningR等书籍比起来有点弱,R语言的书越出越多,好书真没几本。反正抱怨了不少了,不再提它了,下一步就是作图包:ggplot2的讲解,看完ggplot2,那原创 2017-04-17 15:00:54 · 809 阅读 · 0 评论 -
R语言编程艺术 第十一、十二章
重头戏来了,字符串是重点,虽然我以前也发过相关的博文,但是看看R语言编程艺术这本书是怎么讲解的。第十一章:字符串操作:grep(pattern,x)语句在字符串向量x里搜索给定子字符串pattern。sprintf(...)按一定格式把若干个组件组合成字符串。例如:i s“the square of %d is %d”,i,i^2) s 结果:“the square o原创 2017-04-17 15:00:50 · 540 阅读 · 0 评论 -
R语言编程艺术 第九、十章
第9章:面向对象的编程9.1.X章,我有点看的稀里糊涂的,太编程化了。汗......好吧,后面讲的S4和S3,区别我是懂得,但是不会用。目前估计看不懂,等我学会python再来看看,毕竟不是专业的程序员。数据狗不好做。直接到9.4.5 exists()函数:根据其参数是否存在返回TRUE或FALSE。要注意把参数放在引用号里面。直接下一章,感兴趣的朋友可以看看第九章的内容,的确原创 2017-04-17 15:00:45 · 351 阅读 · 0 评论 -
R语言编程艺术 第七八章
发文字有非法字符,搞半天没搞定,所以截图发图片:第七八章" TITLE="R语言编程艺术 第七八章" />第七八章" TITLE="R语言编程艺术 第七八章" />第七八章" TITLE="R语言编程艺术 第七八章" />第七八章" TITLE="R语言编程艺术 第七八章" />原创 2017-04-17 15:00:40 · 594 阅读 · 0 评论 -
R语言 字符串的处理(解析+案例)
数据分析师的日常工作就是数据预处理,数据预处理最经常遇到的问题就是字符串的处理,这部分很难,我以前看过一些R的书和一些技术博客,现在依旧发现有些细节做不好,下面我就转载别人的一些字符串处理的方法,我会在下面说说我的看法:字符串分割函数:strsplit( )字符串连接函数:paste( )计算字符串长度:nchar( )字符串截取函数:substr()及substrin原创 2017-04-17 15:00:31 · 1295 阅读 · 0 评论 -
R语言与网站分析 第9章:样本…
第九章:样本间的关系 P3299.1关联分析信任度(置信度confidence):支持度(support):提升度(lift):关联分析:设置取值范围为[0%,100%]的最小支持度阈值min_sup和最小信任度阈值min_confid,提升度lift要大于1才有意义。9.1.2Apriori算法的R语言实现arules包的apriori函数,构建稀疏矩阵并转化为apriori函数原创 2017-04-17 15:01:54 · 830 阅读 · 0 评论