数据预测与分析
LuLuZhang15
这个作者很懒,什么都没留下…
展开
-
数据分析 R语言实战 学习笔记 第三章 数据预处理
数据分析 R语言实战 学习笔记 第三章 数据预处理 (下)3.3 缺失值处理R 中缺失值以NA 表示,判断数据是否存在缺失值的函数有两个,最基本的函数是is.na() 它可以应用于向量、数据框等多种对象,返回逻辑值。> attach(data)The following objects are masked fromdata (pos = 3):c转载 2017-04-14 16:27:06 · 3126 阅读 · 0 评论 -
机器学习实例-线性回归模型
#第五章:线性回归模型 数据下载地址:https://github.com/johnmyleswhite/ML_for_Hackerslibrary(ggplot2)ages ggplot(ages,aes(x = AgeAtDeath,fill = factor(Smokes))) + geom_density()+facet_grid(Smokes~.)原创 2017-04-22 21:23:02 · 960 阅读 · 0 评论 -
R语言回归分析
1.回归的多面性回归类型用途简单线性个量化的解释变量来预测一个量化的响应变量(一个因变量、一个自变量)多项式一个量化的解释变量预测一个量化的响应变量,模型的关系是n阶多项式(一个预测变量,但同时包含变量的幂)多元线性用两个或多个量化的解释变量预测一个量化的响应变量(不止一个预测变量)多变量 用一个或转载 2017-04-25 19:50:08 · 23035 阅读 · 1 评论 -
R语言主成分和因子分析
主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法,通过寻找一组更小 的、潜在的或隐藏的结构来解释已观测到的、变量间的关系。1.R中的主成分和因子分析R的基础安装包中提供了PCA和EFA的函数,分别为princomp ()和factanal()转载 2017-04-25 19:51:31 · 2485 阅读 · 0 评论 -
利用分类模型学习特征权重
在有的时候,我们需要学习出特征在分类器中所占的比重,例如判断某个人是否具有贷款资格,特征收入应该比年龄要更重要一些,那么具体重要多少,我们可以通过训练数据学习出来。第一个办法可以借鉴决策树中特征选择的思想,以贷款为例,特征向量={年龄,收入,有房子,婚否}。通过计算每个特征Ai在训练数据集下的信息增益: gi(D,Ai)=H(D)−H(D|Ai),i=1,2,3,4转载 2017-07-12 10:56:59 · 1538 阅读 · 0 评论 -
Kibana搜索数据
您可以通过在查询栏中输入搜索条件来搜索与当前索引模式匹配的索引。您可以执行简单的文本搜索,使用 Lucene 查询语法,或使用完整的基于 JSON 的 Elasticsearch Query DSL。当您提交搜索请求时,柱状图,文档表和字段列表会更新以反映搜索结果。命中的总数(匹配文档)显示在工具栏中。文件表显示前五百次点击。默认情况下,匹配按时间倒序排列,最新的文档将首先显示。您可以转载 2017-11-03 16:20:51 · 4202 阅读 · 0 评论