R语言学习笔记
阿丘妍妍
这个作者很懒,什么都没留下…
展开
-
决策树与随机森林(2)——R语言学习
决策树与随机森林二、随机森林bootstrap方法:从样本集进行有放回的重采样。随机森林步骤:样本的随机:从样本集中用Bootstrap随机选取n个样本特征的随机:从所有属性中随机选取K个属性,选择最佳分割属性作为节点建立CART决策树重复以上两步m次,即建立了m棵CART决策树这m个CART形成随机森林,通过投票表决结果,决定数据属于哪一类(投票机制有一票否决制、少数服从多数、加权多数)...翻译 2020-06-12 09:59:16 · 523 阅读 · 0 评论 -
决策树与随机森林(1)——R语言学习
决策树与随机森林1、树形模型和线性模型树形模型:一个一个特征值进行处理。线性模型:所有特征值基于权重相加得到的一个新值。2、决策树和逻辑回归决策树:对每一个特征值做一个划分,非线性分割。逻辑回归:将所有特征值变换为概率后,通过大于某个概率阙值的划分为一类,小于某一个阙值的为另一类,线性分割。3、树形模型优点更加接近人的思维方式,可以产生可视化的分类规则,产生的模型具有可解释性。树模型拟合出来的函数其实是分区间的阶梯函数。4、重要的基本概念根节点:最重要的特征父节点与子节点:这两个是一对原创 2020-06-12 09:46:32 · 746 阅读 · 0 评论 -
朴素贝叶斯——R语言
朴素贝叶斯原理介绍基于贝叶斯方法的分类器是利用训练数据并根据特征的取值来计算每个类别被观察到的概率。当分类器之后被用于无标签数据时,分类器就会根据观测的概率来预测新的特征值最有可能属于哪个类别。主要应用领域文本分类,例如垃圾邮件过滤、作者识别和主题分类等。在计算机网络中进行入侵检测或者异常检测。根据一组观察到的症状,诊断身体情况。文本分析应用场景情绪分析最简单是一个二分类任务,可以考虑在评论中提取正面和负面的短语进行分类。垃圾邮件检测重要的商业应用程序,将电子原创 2020-06-11 18:54:03 · 4236 阅读 · 0 评论 -
R语言学习笔记——数据结构(2)(数据框)
数据框数据框是指有若干个行和列的数据集,它与矩阵类似,但是并不要求所有列都是相同的类型;数据框就是一个列表,它的每个成分都是一个向量,并且长度相同,以表格的形式展现。数据框是有列向量组成、有着矩阵形式的列表数据框与最常见的数据表是对应的:每列代表一个变量属性,每行代表一条样本数据:1、数据框的建立data.frame() #用函数创建>sjk<-data.frame(...原创 2020-05-07 15:44:47 · 578 阅读 · 0 评论 -
数据清洗——(tidyverse包 管线处理)
tidyverse包用现代优雅的方式。以管道是、泛函是编程技术实现了数据科学的整个流程:数据导入、数据清洗、数据操作、数据可视化、数据建模、可重现与交互报告。一、管线操作magrittr包引入了管道操作,能够通过管道将数据从一个函数传给另一个函数。从而用若干个函数构成的管线一次变换数据。...原创 2020-04-27 16:00:50 · 415 阅读 · 1 评论 -
R语言学习笔记——R数据结构(2)(列表)
数据结构2四、列表列表可以包含不同类型的对象,甚至可以包含其他列表,列表的灵活性使得它非常有用。1.创建列表可以用函数list()创建列表,不同类型的对象可以被装进同一个列表中。> m=list(1,c(TRUE,FALSE),c("a","b","c"))> m[[1]][1] 1[[2]][1] TRUE FALSE[[3]][1] "a" "b" "c"...原创 2020-04-22 16:19:05 · 328 阅读 · 0 评论 -
R语言学习笔记——R数据结构(1)(二维数据:矩阵)
数据结构1二.矩阵(二维数据)矩阵是一个用两个维度表示和访问的向量。因此,适用于向量的性质和方法大多也适用于矩阵:矩阵也要求元素是同一类型的,数值矩阵、逻辑矩阵等。1、创建矩阵(1)用matrix()函数将变量变成矩阵,其基本格式如下:matrix(x,nrow,ncol,byrow = FALSE,dimnames )其中x :为数据向量作为矩阵的元素;nrow:设定行数;...原创 2020-04-21 15:59:46 · 2049 阅读 · 0 评论