HexaGAN:Generative Adversarial Nets for Real World Classification解读

HexaGAN:Generative Adversarial Nets for Real World Classification解读

参考文章
class imbalance(类别不均衡)

  1. 解决的问题:大部分的分类模型中需要干净的数据,然而中现实中的数据大部分存在三个问题
    1)数据丢失:数据完全随机丢失(MCAR),数据随机丢失(MAR),数据丢失(但是)不是随机的(MNAR)。
    2)类别不均衡:这是机器学习中的问题,其中一类数据的总数(正)远小于另一类数据的总数(负)。 这个问题在实践中极为 普遍,可以在包括欺诈检测,异常检测,医学诊断,漏油检测,面部识别等在内的各个学科中观察到。
    3) 标签丢失:部分样本数据的标签丢失或不足

  2. 解决办法:本文通过创建HexaGAN网络来同时解决这三类问题,从而对真实数据进行分类:整个网络分为三个模块由六个组件组成,整个网络如下:

    图中及文中所用符号说明:
    E:编码器 将标记和未标记的实例都转移到隐藏空间中。
    GMI:生成器 填补缺失的数据
    GCG生成器 生成条件隐藏向量

    1)丢失数据填补(Missing Data Imputation):使用生成模型表示的数据分布来填充缺失元素。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值