![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 67
hahahaWhy
Learn something new every day!
展开
-
计算AUC 95%的置信区间,python实现
计算AUC 95%的置信区间,python实现代码def bootstrap_auc(clf, X_train, y_train, X_test, y_test, nsamples=1000): auc_values = [] for b in range(nsamples): idx = np.random.randint(X_train.shape[0], size=X_train.shape[0]) clf.fit(X_train.iloc[idx]原创 2022-05-19 17:33:46 · 8150 阅读 · 2 评论 -
predict和predict_proba带入roc_auc_score结果不同
predict和predict_proba带入roc_auc_score结果不同我们都知道AUC表示ROC曲线下的面积,下面两种计算格式(二分类):# 带入预测的概率进行计算roc1=roc_auc_score(y_test, model.predict_proba(x_test)[:, 1])# 带入预测的分类进行计算roc2=roc_auc_score(y_test, model.predict(x_test))结果是roc2小于roc1为什么呢?如图,ROC是通过将不同thresho原创 2022-05-19 15:23:39 · 1685 阅读 · 1 评论 -
机器学习中的交叉验证
机器学习中的交叉验证当数据集较小的时候,希望有更多的数据用于模型的训练,但又无法获得数据时,交叉验证就是一种较好的重复利用数据的方式.交叉验证,目的是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓“交叉”。简单的训练集和测试集的分割把整个数据集分成两部分,一部分用于训练,一部分用于验证,这也就是我们经常提到的训练集(train原创 2021-08-06 14:44:23 · 1042 阅读 · 0 评论 -
机器学习中的评价指标——Precision、 Recall 、AP and F1 score
Accuracy、ErrorRate、Presion、Recall、AP、mAP、F1 score、F1 MACRO的理解Accuracy(精度)和Error Rate(错误率)是分类模型中最常见的两种性能度量指标,既适用于二分类任务,也适用于多分类任务。对于分类模型 f 和大小为 n测试集 D,Accuracy的定义为:Accuracy(f;D)=1n∑i=1n(f(xi)=labeli)Accuracy(f;D)=\frac{1}{n}\sum_{i=1}^n(f(x_i)=label_i)原创 2021-08-05 16:51:13 · 7115 阅读 · 0 评论