《机器学习》习题2-2
数据集包括100个样本,其2的期望中正例反例各一半,假定学习算法所产生的模型是将新样本预测为训练样本数较多的类别,给出用10折交叉验证法对错误率进行评估的结果。
分析:
所抽取的训练集会有正例反例各占一半,利用十折交叉验证抽到的样本正反例概率一致,错误率的期望是0.5。
#由于本人是非计算机专业本科生,代码粗糙也可能运行起来会有问题,仅供参考,代码有误还望指出~
##10折交叉验证法
from sklearn.datasets import make_blobs
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
%matplotlib inline
##创建一个合成数据集
X, Y = make_blobs(n_features=2,n_samples=100,centers=