scikit-learn作业题

本文通过scikit-learn库的make_classification创建了一个数据集,并利用KFold进行交叉验证。分别使用了朴素贝叶斯、支持向量机和随机森林三种算法进行训练,并采用精确率、F1值和AUC ROC曲线作为性能评估指标。
摘要由CSDN通过智能技术生成

作业题目:


解题思路:

1.用sklearn的datasets中的make_classification函数创建一个数据集,根据所给提示,我们设置n_samples=1000, n_features=10;

2.用交叉验证分离数据集为10份,用cross_validation的KFolds函数;

3.分别使用三种训练算法:朴素贝叶斯、支持向量机和随机森林;

4.分别使用三种指标评估交叉验证的性能:精确率、F1值、AUC ROC曲线。

代码:

from sklearn import datasets
from sklearn import cross_validation
from sklearn.naive_bayes import GaussianNB
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
from sklearn import metrics

#创建数据集
dataset = datasets.make_classification(n_samples=1000, n_features=10)

#用交叉验证分离数据
cv = cross_validation.KFold(len(dataset[0]), n_folds=10, shuffle=True)
for train_index, test_index in cv:
    X_train, y_train = dataset[0][train_index], d
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值