R语言学习
MongoVIP
学无止境,很多事情并不是做不到,只是看你愿不愿意去做
展开
-
R语言学习笔记_语法学习
数据类型character:字符型numeric:数值型,指实数或小数integer:整型complex:复数型logical:逻辑型数据结构数据分析的对象数值变量分类变量(有序、无序)向量、因子矩阵、数据框数组、列表向量 创建向量 c() x = c(1,2,3,4,5) 冒号操作符: ...原创 2019-04-04 21:24:53 · 320 阅读 · 0 评论 -
R语言学习_决策树
分类算法家族决策树ID.3、C4.5、C5.0CART(Classification and Regression Tree, 分类回归树)元模型Bagging、Boosting、随机森林贝叶斯朴素贝叶斯、贝叶斯网络懒惰算法knn决策树的庐山面目 根节点 一棵决策树只有一个根节点 叶节点 中间节点 二叉树和多叉树 ...原创 2019-04-08 17:39:31 · 1351 阅读 · 0 评论 -
R语言学习_关联规则
关联规则挖掘目的发现商品之间的关系模式指标 支持度 support(x) = P(x) 置信度 confidence(X -> Y) = support(X,Y)/support(X) 提升度 lift(X -> Y) = confidence(X -> Y)/support(Y) 关联规则 最小支持度阈值、最小置信度阈值Apriori算...原创 2019-04-08 17:36:43 · 696 阅读 · 0 评论 -
R语言学习_基本操作
原创 2019-04-08 17:32:46 · 138 阅读 · 0 评论 -
R语言学习_数据降维
纬度灾难变量过多(没用的变量)变量相关(相关的变量)解决办法剔除无用变量逐步回归向前引入法向后剔除法逐步筛选法Step函数AIC越小越好 AIC = n ln(SSE) + 2p主成分分析快速降维技术降维过程中不影响解的精度消除多重共线性 数学工具 原变量线性组合得到新变量;方差的重新分配,保留几个方差最大的变量; ...原创 2019-04-04 21:38:18 · 2022 阅读 · 0 评论 -
R语言学习_聚类方法
聚类距离(点和点、类和类)相关系数层次聚类法K-means聚类法聚类(“物以类聚,人以群分”)聚类是一种无监督的学习,使用聚类不需要提前被告知要划分的组是什么样的,甚至在我们不知道找什么时就自动完成分组。根据样本点的几何特征完成分类距离距离————样本(点)之间相似程度 闵可夫斯基距离(Minkowski) 棋盘距离(曼哈顿距离) 欧式距离...原创 2019-04-04 21:37:06 · 1045 阅读 · 0 评论 -
R语言学习_回归预测
相关与回归的联系相关与回归不独立两个随机变量,二者之间肯定会存在某种关系:函数关系(确定性关系)相关关系(非确定关系)散点图观察相关性相关性的程度相关系数相关关系不是因果关系一元线性回归 一元线性回归————数学思想 最佳回归线 不同的人会找到不同的‘最佳’回归线 残差平方和最小为‘最佳’ 普...原创 2019-04-04 21:35:06 · 12686 阅读 · 1 评论 -
R语言学习笔记_数据清理2
统计学是如何总结数据特点的分布(离散型、连续型)描述、相关单变量:描述集中趋势、分散趋势双变量:相关共同变化趋势(协方差、相关系数)可视化探索数据分布分布就是概率可能结果(取值)有哪些每个结果或者某个范围内的概率是多少?可视化展现概率密度图累积分布图常见分布分类变量:二项分布、泊松分布数值变量:均匀分布、正态分布、指数分布得到分布是研究的最高境界,说着容易做着难...原创 2019-04-04 21:31:52 · 517 阅读 · 0 评论 -
R语言学习笔记_数据清理1
导入数据之前明确需求理解数据数据质量导入数据支持多种数据源文本文件read.table、read.csv、read.delimscanExcel文件csv、prn格式+read.csv剪贴板+read.delimxlsx扩展包rodbc包数据清洗缺失值处理NA、NaN、Inf、-Inf识别缺失数据先把不合理值重编码为缺失值is.na、complete.case...原创 2019-04-04 21:28:52 · 2116 阅读 · 1 评论 -
R语言学习_创建数据集
matrix语法格式mymatrix <- matrix(vector, nrow = number_of_rows, ncol = number_of_columns, byrow = logical_value, dimnames = list(char_vector_rownames, char_vector_colnames))vector包含了矩阵的元素。nrow和nco...原创 2019-04-08 23:52:47 · 658 阅读 · 0 评论