文章目录
阿里天池训练营day05:鸢尾花数据集贝叶斯分类
鸢尾花数据集特征在day03中已经详细的解释了,这里直接进行分类和分析
1. 内容简介
Step1: 库函数导入
Step2: 数据导入&分析
Step3: 模型训练
Step4: 模型预测
Step5: 原理简析
2. 算法实践
2.1 Step1: 库函数导入
import warnings
warnings.filterwarnings('ignore')
import numpy as np
# 加载莺尾花数据集
from sklearn import datasets
# 导入高斯朴素贝叶斯分类器
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split
2.2 Step2: 数据导入&分析
X, y = datasets.load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
我们需要计算两个概率分别是:条件概率: P ( X ( i ) = x ( i ) ∣ Y = c k ) P(X^{(i)}=x^{(i)}|Y=c_k) P(X(i)=x(i)∣Y=c