Keras 中数据不均衡时，metrics，class_weight的设置方法

最新推荐文章于 2022-10-25 14:36:37 发布

小北小白

最新推荐文章于 2022-10-25 14:36:37 发布

阅读量1w

点赞数 1

文章标签： class_weight Kears metrics imblance

当数据处理不均衡时，比如处理癌症训练问题，有病样本很少，参考：

http://www.deepideas.net/unbalanced-classes-machine-learning/

主要从两个方面着手：

一、loss函数的权重问题

训练时，设置的权重：

class_weight={
    1: n_non_cancer_samples / n_cancer_samples * t
}

二、编译时设置模型的metrics

def sensitivity(y_true, y_pred):
    true_positives = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))
    possible_positives = K.sum(K.round(K.clip(y_true, 0, 1)))
    return true_positives / (possible_positives + K.epsilon())

def specificity(y_true, y_pred):
    true_negatives = K.sum(K.round(K.clip((1-y_true) * (1-y_pred), 0, 1)))
    possible_negatives = K.sum(K.round(K.clip(1-y_true, 0, 1)))
    return true_negatives / (possible_negatives + K.epsilon())

model.compile(
    loss='binary_crossentropy',
    optimizer=RMSprop(0.001),
    metrics=[sensitivity, specificity]
)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小北小白

关注关注

1
点赞
踩
17

收藏

觉得还不错? 一键收藏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Tensorflow 2.x(keras)源码详解之第九章：模型训练和预测的三种方法(fit&tf.GradientTape&train_step&tf.data)

weixin_43178406的博客

05-16

6万+

文章目录1. 模型训练和预测步骤2. 使用内置方法fit进行训练和评估2.1 简单案例解析2.2 compile编译2.3 处理非标准化的损失和评估指标：add_loss&add_metric2.4 自动切分验证集2.5 使用tf.data数据进行训练2.6 使用tf.keras.utils.Sequence数据进行训练2.7 多输出，指定不同的损失函数和评估指标2.8 样本不均衡：类权重和样本权重2.9 使用回调(callbacks)2.10 学习率衰减3. 从头开始编写循环训练3.1 fit源码

Tensorflow 2.x(keras)源码详解之第十三章：keras中的评价指标及自定义评价指标

weixin_43178406的博客

06-11

1万+

本文主要介绍了Tensorflow 2.x(keras)源码详解之第十三章：keras中的评价指标及自定义评价指标，希望能对学习TensorFlow 2的同学有所帮助。文章目录 1. keras中API使用方法 2. 自定义评价指标

8 条评论您还未登录，请先登录后发表或查看评论

keras 在不平衡数据上的 fit -- class_weight

Nick Blog

04-19

1万+

keras已经在新版本中加入了 class_weight = 'auto'。设置了这个参数后，keras会自动设置class weight让每类的sample对损失的贡献相等。例子如下：clf.fit([X_head_train,X_body_train], y_train_embedding, epochs=10, batch_size=128, class_weight = 'auto', v...

keras中处理样本不平衡

棉花糖的博客

04-01

7476

参考文献：https://blog.csdn.net/sinat_26917383/article/details/72857454 应对不均衡样本的情况使用：class_weight,sample_weight 两者的区别为： class_weight—主要针对的上数据不均衡问题，比如：异常检测的二项分类问题，异常数据仅占1%，正常数据占99%; 此时就要设置不同类对loss...

Keras class_weight和sample_weight用法

/dev/null

12-19

1942

搬运: https://stackoverflow.com/questions/57610804/when-is-the-timing-to-use-sample-weights-in-keras import tensorflow as tf import numpy as np data_size = 100 input_size=3 classes=3 x_train = np...

样本不均衡---权重设置（keras,sklearn）class_weight

pangxing6491的博客

07-19

6078

https://www.cnblogs.com/qi-yuan-008/p/11992156.html https://blog.csdn.net/weixin_38385446/article/details/88948076

深度学习—— （5）数据不平衡之class_weight

羊羊的博客

07-20

1651

数据不平衡 class_weight loss_function

keras中模型训练class_weight,sample_weight区别说明

09-16

在Keras中，模型训练时会遇到两类重要的权重参数：`class_weight`和`sample_weight`。它们都是为了应对特定训练场景中的挑战，但作用方式有所不同。首先，`class_weight`是针对数据不平衡问题设计的。在分类任务中...

tensorflow 里metrics,Tensorflow：如何在多类分类中使用tf.keras.metrics？

weixin_28917337的博客

12-21

1381

I want to use some of these metrics when training my neural network:METRICS = [keras.metrics.TruePositives(name='tp'),keras.metrics.FalsePositives(name='fp'),keras.metrics.TrueNegatives(name='tn'),ker...

TensorFlow.Keras.Model class 详解

最新发布

Larkin_0612的博客

10-25

2023

TensorFlow中Model详解，新手入门

halcon ocr 生成样本变体_机器学习中样本不平衡，怎么办？

weixin_42099633的博客

12-19

327

在银行要判断一个"新客户是否会违约"，通常不违约的人VS违约的人会是99:1的比例，真正违约的人其实是非常少的。这种分类状况下，即便模型什么也不做，全把所有人都当成不会违约的人，正确率也能有99%，这使得模型评估指标变得毫无意义，根本无法达到我们的"要识别出会违约的人"的建模目的。像这样样本不均衡等例子在生活中随处可见。通常出现在异常检测、客户流失、罕见时间分析、发生低频率事件等场景...

tensorflow中model.compile()

X1996_的博客

05-04

2536

model.compile()用来配置模型的优化器、损失函数，评估指标等里面的具体参数有： compile( optimizer='rmsprop', loss=None, metrics=None, loss_weights=None, weighted_metrics=None, run_eagerly=None, steps_per_execution=None, jit_compile=None, **kwargs ) 我

sklearn 样本均衡 class_weight='balanced'的实现方法

Pilgrim

04-26

3万+

想了解这个的原因，是因为Gbdt不能设置这个参数，但是GBDT是最常用的分类器了... 查了一会儿还想了下原理，想知道原理上为啥gbdt不能设置class_weight... 然后发现虽然sklearn没有这个选项，但是LightGBM是有的啊...所以应该是可以实现，但是Sklearn只是没有实现而已。。。 scale_pos_weight, default=1.0, type=doub

keras使用class weight和sample weight处理不平衡问题

yisun123456的博客

08-03

2218

在机器学习或者深度学习中，经常会遇到正负样本不平衡问题，尤其是广告、push等场景，正负样本严重不平衡。常规的就是上采样和下采样。这里介绍Keras中的两个参数 class_weight和sample_weight 1、class_weight 对训练集中的每个类别加一个权重，如果是大类别样本多那么可以设置低的权重，反之可以设置大的权重值 2、sample_weight 对每个样本加权中，思路与上面类似。样本多的类别样本权重低例如 model.fit(class_weight={0:1.,1:

keras处理样本不均衡问题

weixin_42386003的博客

09-19

1963

处理数据不平衡问题 1. 传统方法 1.1 随机过采样 1.2 欠采样 1.3 数据合成 2. 利用keras中的fit方法里的参数 2.1 class_weight 2.1.1 利用sklearn.utils.class_weight来计算权重 2.1.2 计算total_num/sample_num*t来设置权重 2.2 sample_weight 2.3 注意的点 1. 传统方法 1.1 随机过采样随机过采样的核心思想，就是随机.

关于sklearn下class_weight参数的一点源码阅读与测试

go_og的专栏

07-30

1万+

一直没有很在意过sklearn的class_weight的这个参数的具体作用细节，只大致了解是是用于处理样本不均衡。后来在简书上阅读svm松弛变量的一些推导的时候，看到样本不均衡的带来的问题时候，想更深层次的看一下class_weight的具体作用方式， svm松弛变量的简书链接：https://www.jianshu.com/p/8a499171baa9 该文中的样本不均衡的描述： “样本...

随机森林（原理/样例实现/参数调优）