朴素贝叶斯算法实现印第安人数据集分类
Step1:导包—pandas/sklearn/numpy
read_csv- 读取csv文件
train_test_split 把样本数据划分为测试集和训练集
Cross_val_score 通过交叉验证评估分数
klearn.cross_validation.cross_val_score(estimator, X, y=None, scoring=None, cv=None, n_jobs=1, verbose=0, fit_params=None, pre_dispatch=‘2*n_jobs’
Step2:数据特征选择及划分
Train_test_split需要数据和标签,所以在导入数据的过程中要拿出标签。
Step3:关于朴素贝叶斯的使用
简而言之,分析一下数据分布,离散的话就用二项分布或者伯努利,连续就用高斯分布。
Step4:模型配置及训练……
Step5:模型保存
下载后方便下次使用