题目:
1 创建分类数据集(要求:样本数≥1000,特性≥10)
2 使用10重交叉验证拆分数据集
3 训练算法:
GaussianNB算法
SVC算法(C的可能值:[1e-02,1e-01,1e00,1e01,1e02],RBF内核)
RandomForestClassifier算法(n估计值的可能值:[10,100,1000])
4 评估交叉验证的性能:
准确性
F1-score
AUC ROC
代码:
from sklearn import datasets, cross_validation
from sklearn.naive_bayes import GaussianNB
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
from sklearn import metrics
def evaluate(y_test, pred, method):
acc = metrics.accuracy_score(y_test, pred)