K折验证报错：TypeError: init() got multiple values for argument 'shuffle'

最新推荐文章于 2024-05-24 15:31:43 发布

curd_boy

最新推荐文章于 2024-05-24 15:31:43 发布

阅读量4.3k

点赞数 3

分类专栏： Bedug

本文链接：https://blog.csdn.net/weixin_43746433/article/details/96283622

版权

Bedug 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

贴出原代码

import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import KFold
from sklearn.cross_validation import cross_val_score

admissions = pd.read_csv("./data/admissions.csv")
admissions["actual_label"] = admissions["admit"]
admissions = admissions.drop("admit", axis=1)

kf = KFold(len(admissions), 5, shuffle=True, random_state=8)
lr = LogisticRegression()
#roc_auc 
accuracies = cross_val_score(lr,admissions[["gpa"]], admissions["actual_label"], scoring="roc_auc", cv=kf)
average_accuracy = sum(accuracies) / len(accuracies)

print(accuracies)
print(average_accuracy)

这段代码本身是没有问题的，但由于库版本的原因，有的人在运行这段代码后，出现以下错误：

ModuleNotFoundError: No module named 'sklearn.cross_validation'

from sklearn.cross_validation import KFold改为from sklearn.model_selection import KFold，再运行却发现有了新的问题

TypeError: __init__() got multiple values for argument 'shuffle'

其实这是导入 KFold的方式不同引起的。如果使用:from sklearn.cross_validation import KFold ，来导包那么：

KFold(n,5,shuffle=False)  # n为总数，需要传入三个参数

但如果你使用:from sklearn.model_selection import KFold，那么：

fold = KFold(5,shuffle=False)  # 无需传入n

改进的代码

import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score

admissions = pd.read_csv("./data/admissions.csv")
admissions["actual_label"] = admissions["admit"]
admissions = admissions.drop("admit", axis=1)

kf = KFold(5, shuffle=True, random_state=8)
lr = LogisticRegression()
#roc_auc
accuracies = cross_val_score(lr,admissions[["gpa"]], admissions["actual_label"], scoring="roc_auc", cv=kf)
average_accuracy = sum(accuracies) / len(accuracies)

print(accuracies)
print(average_accuracy)

在这里插入图片描述

curd_boy

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
K折验证报错：TypeError: __init__() got multiple values for argument 'shuffle'

贴出原代码import pandas as pdfrom sklearn.linear_model import LogisticRegressionfrom sklearn.cross_validation import KFoldfrom sklearn.cross_validation import cross_val_scoreadmissions = pd.read_csv(...
复制链接

扫一扫