自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

翻译 决策树与随机森林(2)——R语言学习

决策树与随机森林二、随机森林bootstrap方法:从样本集进行有放回的重采样。随机森林步骤:样本的随机:从样本集中用Bootstrap随机选取n个样本特征的随机:从所有属性中随机选取K个属性,选择最佳分割属性作为节点建立CART决策树重复以上两步m次,即建立了m棵CART决策树这m个CART形成随机森林,通过投票表决结果,决定数据属于哪一类(投票机制有一票否决制、少数服从多数、加权多数)...

2020-06-12 09:59:16 508

原创 决策树与随机森林(1)——R语言学习

决策树与随机森林1、树形模型和线性模型树形模型:一个一个特征值进行处理。线性模型:所有特征值基于权重相加得到的一个新值。2、决策树和逻辑回归决策树:对每一个特征值做一个划分,非线性分割。逻辑回归:将所有特征值变换为概率后,通过大于某个概率阙值的划分为一类,小于某一个阙值的为另一类,线性分割。3、树形模型优点更加接近人的思维方式,可以产生可视化的分类规则,产生的模型具有可解释性。树模型拟合出来的函数其实是分区间的阶梯函数。4、重要的基本概念根节点:最重要的特征父节点与子节点:这两个是一对

2020-06-12 09:46:32 741

原创 朴素贝叶斯——R语言

朴素贝叶斯原理介绍基于贝叶斯方法的分类器是利用训练数据并根据特征的取值来计算每个类别被观察到的概率。当分类器之后被用于无标签数据时,分类器就会根据观测的概率来预测新的特征值最有可能属于哪个类别。主要应用领域文本分类,例如垃圾邮件过滤、作者识别和主题分类等。在计算机网络中进行入侵检测或者异常检测。根据一组观察到的症状,诊断身体情况。文本分析应用场景情绪分析最简单是一个二分类任务,可以考虑在评论中提取正面和负面的短语进行分类。垃圾邮件检测重要的商业应用程序,将电子

2020-06-11 18:54:03 4225

原创 R语言学习笔记——数据结构(2)(数据框)

数据框数据框是指有若干个行和列的数据集,它与矩阵类似,但是并不要求所有列都是相同的类型;数据框就是一个列表,它的每个成分都是一个向量,并且长度相同,以表格的形式展现。数据框是有列向量组成、有着矩阵形式的列表数据框与最常见的数据表是对应的:每列代表一个变量属性,每行代表一条样本数据:1、数据框的建立data.frame() #用函数创建>sjk<-data.frame(...

2020-05-07 15:44:47 576

原创 数据清洗——(tidyverse包 管线处理)

tidyverse包用现代优雅的方式。以管道是、泛函是编程技术实现了数据科学的整个流程:数据导入、数据清洗、数据操作、数据可视化、数据建模、可重现与交互报告。一、管线操作magrittr包引入了管道操作,能够通过管道将数据从一个函数传给另一个函数。从而用若干个函数构成的管线一次变换数据。...

2020-04-27 16:00:50 413 1

原创 R语言学习笔记——R数据结构(2)(列表)

数据结构2四、列表列表可以包含不同类型的对象,甚至可以包含其他列表,列表的灵活性使得它非常有用。1.创建列表可以用函数list()创建列表,不同类型的对象可以被装进同一个列表中。> m=list(1,c(TRUE,FALSE),c("a","b","c"))> m[[1]][1] 1[[2]][1] TRUE FALSE[[3]][1] "a" "b" "c"...

2020-04-22 16:19:05 324

原创 R语言学习笔记——R数据结构(1)(高位数据:多维数组)

数据结构1三、多维数组(高维数据)向量/矩阵向更高维度的自然推广。多为数组就是一个维度更高(通常大于2)、可访问的向量。数组也要求元素是同一类型的。1、创建多维数组用函数array()建一个变量变成多为数组,基本格式为:array(x,dim= ,dimnames = )x: 为数据向量作为多维数组的元素。dim:设置多维数组各维度的维数。dimnames:设置多维数组各维度的...

2020-04-21 17:01:17 1208

原创 R语言学习笔记——R数据结构(1)(二维数据:矩阵)

数据结构1二.矩阵(二维数据)矩阵是一个用两个维度表示和访问的向量。因此,适用于向量的性质和方法大多也适用于矩阵:矩阵也要求元素是同一类型的,数值矩阵、逻辑矩阵等。1、创建矩阵(1)用matrix()函数将变量变成矩阵,其基本格式如下:matrix(x,nrow,ncol,byrow = FALSE,dimnames )其中x :为数据向量作为矩阵的元素;nrow:设定行数;...

2020-04-21 15:59:46 2044

原创 R语言学习笔记——R数据结构(1)(一维数据:向量)

R数据结构(1)数据结构同质性数据结构异质性数据结构向量矩阵多维数组列表数据框除此之外还有字符串、日期时间数据、时间序列数据等。(一)向量(一维数据)常用的向量为:数值向量、逻辑向量、字符向量1.数值向量(1)数值向量是由数值组成的向量,单个数值的长度为1的数值向量> x<-1.5> x[1] 1.5> numeric(10) #可以用numeric...

2020-04-21 15:02:30 1867

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除