简单的朴素贝叶斯算法应用于一个简单的数据

最新推荐文章于 2022-04-15 16:00:19 发布

Tough Touch

最新推荐文章于 2022-04-15 16:00:19 发布

阅读量1.2k

点赞数

文章标签：朴素贝叶斯代码案例

本文链接：https://blog.csdn.net/zzzjh_jj/article/details/89852716

版权

朴素贝叶斯在一些情况下分类效果还是不错的，一般常用于文本分析，如垃圾邮件分类等。
本文不介绍朴素贝叶斯算法的理论部分，直接给出一个数据集的案例分析。

数据集由几个医学预测变量和一个目标变量组成Outcome。预测变量包括患者的怀孕次数，BMI，胰岛素水平，年龄等。

数据集的目的是基于数据集中包括的某些诊断测量来诊断性地预测患者是否患有糖尿病。从较大的数据库中选择这些实例存在一些限制。特别是，这里的所有患者都是至少21岁的皮马印第安人遗产的女性。

本文基于朴素贝叶斯算法，使用R语言建模

目的是建立一个预测模型，以预测新科目的糖尿病。

数据将分为训练和测试数据集75/25分流比。
评估将在测试数据集上进行。

其中，将结果变量更改为一个因子：真（有糖尿病）和假（没有糖尿病）。

先加载要使用的包，若包未下载，使用install.packages()下载即可。

library(tidyverse) 
library(ggplot2)
library(caret)
library(caretEnsemble)
library(psych)
library(Amelia)
library(mice)
library(GGally)
library(rpart)

读入数据，路径自设，此处省略

Xdata<- read.csv("....../diabetes.csv") 

#将结果变量Outcome转化为因子变量
Xdata$Outcome <- factor(Xdata$Outcome, levels = c(0,1), labels = c("False", "True"))

-- Attaching packages --------------------------------------- tidyverse 1.2.1 --
√ ggplot2 3.1.0       √ purrr   0.2.5  
√ tibble  2.1.1       √ dplyr   0.8.0.1
√ tidyr   0.8.3       √ stringr 1.3.1  
√ readr   1.3.1       √ forcats 0.3.0  
-- Conflicts ------------------------------------------ tidyverse_conflicts() --
x dplyr::filter() masks stats::filter()
x dplyr::lag()    masks stats::lag()

载入需要的程辑包：lattice

载入程辑包：‘caret’

The following object is masked from ‘package:purrr’:

    lift

Warning message:
程辑包‘caret’是用R版本3.5.3 来建造的 
载入程辑包：‘caretEnsemble’

The following object is masked from ‘package:ggplot2’:

    autoplot

Warning message:
程辑包‘caretEnsemble’是用R版本3.5.3 来建造的 

载入程辑包：‘psych’

The following objects are masked from ‘package:ggplot2’:

    %+%, alpha

Warning message:
程辑包‘psych’是用R版本3.5.3 来建造的 

载入需要的程辑包：Rcpp
## 
## Amelia II: Multiple Imputation
## (Version 1.7.5, built: 2018-05-07)
## Copyright (C) 2005-2019 James Honaker, Gary King and Matthew Blackwell
## Refer to http://gking.harvard.edu/amelia/ for more information
## 
Warning message:
程辑包‘Amelia’是用R版本3.5.3 来建造的 

载入程辑包：‘mice’

The following object is masked from ‘package:tidyr’:

    complete

The following objects are masked from ‘package:base’:

    cbind, r

最低0.47元/天解锁文章

Tough Touch

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
简单的朴素贝叶斯算法应用于一个简单的数据

这里写自定义目录标欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Mar...
复制链接

扫一扫