sklearn朴素贝叶斯分类器_sklearn学习之朴素贝叶斯

最新推荐文章于 2023-12-19 14:44:46 发布

weixin_39534780

最新推荐文章于 2023-12-19 14:44:46 发布

阅读量105

点赞数

文章标签： sklearn朴素贝叶斯分类器

注意代码中坐标横轴分层测试集的实现：

train_sizes

---------------------'

# ================================================
# 朴素贝叶斯预测糖尿病
# 与逻辑回归比较
# 2019-03-02
# ================================================
%matplotlib inline   
df = pd.read_csv('./pima-indians-diabetes.data', header=None)
# print(df)
y = df[8]
X = df[[0, 1, 2, 3, 4, 5, 6, 7]]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=11)
print(len(X_train))

lr = LogisticRegression()
nb = GaussianNB()

lr_scores = []
nb_scores = []

print('========不断提高训练的样本数据量=======')
train_sizes = range(10, len(X_train), 10)

for train_size in train_sizes:
    X_slice, _, y_slice, _ = train_test_split(
        X_train, y_train, train_size=train_size, stratify=y_train, random_state=11)
    nb.fit(X_slice, y_slice)
    nb_scores.append(nb.score(X_test, y_test))
    lr.fit(X_slice, y_slice)
    lr_scores.append(lr.score(X_test, y_test))
    
plt.plot(train_sizes, nb_scores, label='Naive Bayes')
plt.plot(train_sizes, lr_scores, linestyle='--', label='Logistic Regression')
plt.title("Naive Bayes and Logistic Regression Accuracies")
plt.xlabel("Number of training instances")
plt.ylabel("Test set accuracy")
plt.legend()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39534780

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sklearn朴素贝叶斯分类器_sklearn学习之朴素贝叶斯

注意代码中坐标横轴分层测试集的实现：train_sizes ---------------------'# ================================================# 朴素贝叶斯预测糖尿病# 与逻辑回归比较# 2019-03-02# ================================================%matplotli...
复制链接

扫一扫