Datawhale AI 夏令营“降水预测”

Datawale笔记

Task1 深入浅出PyTorch

模型评价指标
  1. 混淆矩阵

  2. 二分类混淆矩阵元素:TP, FP, FN, TN

 (1) TP : True Positive
 (2) FP : False Positive(实际为负类但被预测为正类)
 (3) FN : False Negative(实际为正类但被预测为负类)
 (4) TN : True Negattive(实际为负类且预测为负类)
  1. 混淆矩阵代码实现:

 from sklearn.metrics import confusion_matrix
 def compute_confusion_matrix(labels,pred_labels_list,gt_labels_list):
     pred_labels_list = np.asarray(pred_labels_list)
     gt_labels_list = np.asarray(gt_labels_list)
     matrix = confusion_matrix(test_label_list,
                           pred_label_list,
                           labels=labels)
     return matrix

将预测标签和真值标签转换为 NumPy 数组。这样做是为了确保数据类型一致,并且可以利用 NumPy 的高效计算特性。

  1. Overall Accuracy

  2. def : 代表了所有预测正确的样本占所有预测样本总数的比例

  3. 代码实现:

 def compute_oa(matrix):
  """
  计算总体准确率,OA=(TP+TN)/(TP+TN+FP+FN)
  :param matrix:
  :return:
  """
  return np.trace(matrix) / np.sum(matrix)
  1. Average accuracy

    1. def : 每一类预测正确的样本和该类的总量之间的比值求平均值.

    2. 代码实现 : 使用numpy的diag将混淆矩阵的对角线元素取出,并且对于混淆矩阵进行列求和,用对角线元素除以求和后的结果,最后对结果计算求出平均值。

        from sklearn.metrics import confusion_matrix
     ​
     def average_accuracy(labels, pred_labels_list, gt_labels_list):
      pred_labels_list = np.asarray(pred_labels_list)
      gt_labels_list = np.asarray(gt_labels_list)
     cm = confusion_matrix(gt_labels_list,           pred_labels_list, labels=labels)
     ​
     class_accuracies = []
     ​
     for i, label in enumerate(labels):
          true_positive = cm[i, i]
         false_negative = np.sum(cm[i, :]) - true_positive
         accuracy = true_positive / (true_positive + false_negative)
         class_accuracies.append(accuracy)
     ​
     avg_accuracy = np.mean(class_accuracies)
     ​
     return avg_accuracy
  2. Kappa系数

    1. 计算方式 : kappa = (P_o - P_e) / (1 - P_e)

    2. 评估标准 : 越接近1越优 , 负值则表示一致性比随机分类还差

    3. 期望一致性的计算方法 :

    P_e = 0 for i in range(len(labels)): row_sum = np.sum(cm[i, :]) col_sum = np.sum(cm[:, i]) P_e += (row_sum * col_sum) / (N * N)

     ​
  3. Recall召回率

    1. def : 正样本并且也被正确识别为正样本的数量占样本中所有为正样本的比例

  4. Precision

    1. def : 全部预测为正的结果中,被预测正确的正样本所占的比例

  5. F1

    1. F1可以解释为召回率(Recall)和P(精确率)的加权平均

  6. 其他:

    1. 置信度 (划分的阈值)

    2. IOU(通常人们将IOU >=0.7时判定为正样本,其余情况判定为负样本)

    3. AP

    4. mAP

Task2

baseline基本思路
  1. 数据集部分

    1. Features

    2. GT gt的数据类型整体值偏移,且分布不均,在数据处理时应根据此做出适当的数据清洗和调整 可做出如:归一化、标准化、对数变换等改进。给出的baseline中使用移动平均的方式来平滑数据。

  2. 模型部分 可以尝试使用LSTM等时间序列问题的经典模型来优化

  3. 损失函数、优化器等

  4. 模型加载及预测

  • 8
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值