Task1

评价指标

  1. 分类问题常用指标:
    两类:accuracy, Precision,Recall,F-score,Pr曲线,ROC-AUC曲线。
    多类:accuracy, 宏平均和微平均,F-score
ActualClass
10
Predict1True positiveFalse positive
Class0False negetiveTrue negetive
  • accuracy: T p + T n t o t a l \frac{Tp+Tn}{total} totalTp+Tn
  • precision: T p P r e d i c t e d   p o s i t i v e = T p T p + F p \frac{Tp}{Predicted \ positive }=\frac{Tp}{Tp+Fp} Predicted positiveTp=Tp+FpTp
  • recall: T p A c t u a l   p o s i t i v e = T p T p + F n \frac{Tp}{Actual\ positive }=\frac{Tp}{Tp+Fn} Actual positiveTp=Tp+FnTp
  • F1 Score: 2 P R P + R 2\frac{PR}{P+R} 2P+RPR
  1. 回归预测常用指标:平均绝对误差(Mean Absolute Error,MAE),均方误差(Mean Squared Error,MSE),平均绝对百分误差(Mean Absolute Percentage Error,MAPE),均方根误差(Root Mean Squared Error), R2(R-Square)
    M A E = 1 N ∑ i = 1 N ∣ y i − y ^ i ∣ MAE=\frac{1}{N} \sum_{i=1}^{N}\left|y_{i}-\hat{y}_{i}\right| MAE=N1i=1Nyiy^i
    M S E = 1 N ∑ i = 1 N ( y i − y ^ i ) 2 MSE=\frac{1}{N} \sum_{i=1}^{N}\left(y_{i}-\hat{y}_{i}\right)^{2} MSE=N1i=1N(yiy^i)2
    M A P E = 1 N ∑ i = 1 N ∣ y i − y ^ i ∣ y i MAPE=\frac{1}{N} \sum_{i=1}^{N}\frac{|y_{i}-\hat{y}_{i}|}{y_i} MAPE=N1i=1Nyiyiy^i
    R 2 = 1 − S S r e s S S t o t = 1 − ∑ ( y i − y ^ i ) 2 ∑ ( y i − y ‾ ) 2 R^{2}=1-\frac{SS_{res}}{SS_{tot}}=1-\frac{\sum\left(y_{i}-\hat{y}_{i}\right)^{2}}{\sum\left(y_{i}-\overline{y}\right)^{2}} R2=1SStotSSres=1(yiy)2(yiy^i)2

代码

导入数据

读取数据

import pandas as pd

data = pd.read_csv('path', sep=' ')

查看数据基本结构

print('Train data shape:',Train_data.shape)
print('TestA data shape:',Test_data.shape)
Train_data.head()
Train.data.describe()

评价指标示例

  1. 分类指标:accuracy, precision, recall, F1-score, AUC
from sklearn import metrics

print('ACC:', metrics.accuracy_score(y_true, y_pred))
print('Precision', metrics.precision_score(y_true, y_pred))
print('Recall', metrics.recall_score(y_true, y_pred))
print('F1-score:', metrics.f1_score(y_true, y_pred))
print('AUC socre:', metrics.roc_auc_score(y_true, y_scores))
  1. 回归指标:MSE, RMSE, MAE, MAPE, R2 score
import numpy as np
from sklearn import metrics

# MAPE需要自己实现
def mape(y_true, y_pred):
    return np.mean(np.abs((y_pred - y_true) / y_true))

# MSE
print('MSE:',metrics.mean_squared_error(y_true, y_pred))
# RMSE
print('RMSE:',np.sqrt(metrics.mean_squared_error(y_true, y_pred)))
# MAE
print('MAE:',metrics.mean_absolute_error(y_true, y_pred))
# MAPE
print('MAPE:',mape(y_true, y_pred))
print('R2-score:',metrics.r2_score(y_true, y_pred))

参考 https://github.com/datawhalechina/team-learning
Datawhale Task1 赛题理解

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值