Mixup for Node and Graph Classification阅读

一篇来自WWW21的论文,看完觉得颇为有趣,特地记录一下:

mixup是一种CV中常用的数据处理手段,可以从现存的有标签样本中生成新的样本,其思想也非常简单,假设有两个样本 ( x i , y i ) , ( x j , y j ) (x_i,y_i),(x_j,y_j) (xi,yi),(xj,yj),新的样本生成方式为:
x i j = α x i + ( 1 − α ) x j x_{ij}=\alpha x_i+(1-\alpha)x_j xij=αxi+(1α)xj

y i j = α y i + ( 1 − α ) y j y_{ij}=\alpha y_i+(1-\alpha)y_j yij=αyi+(1α)yj
其实也蛮好理解,比方说 x i , x j x_i,x_j xi,xj代表着两张图片,对应的标签分别为1和0, α \alpha α取0.9,即0.9个 x i x_i xi掺了0.1个 x j x_j xj,那么 y i j y_{ij} yij就是0.9,这很符合直觉。
实验证明mixup可以减小训练中的过拟合,这个似乎也可以直观理解:如果样本中标签只有0和1,那么模型再训练时会让预测的标签尽可能地向两端去逼近,但是我们使用mixup可能使得样本的标签处于[0,1]这个区间,从而使得模型预测的结果均匀地分布在这个区间内。

说到这篇论文,这篇论文就是将mixup应用到了图神经网络中的节点分类和图分类两个任务上,先说图分类,因为这个比较简单:

  1. 我们从图分类的样本中取出两个样本 ( G i , y i ) , ( G j , y j ) (G_i,y_i),(G_j,y_j) (Gi,yi),(Gj,yj),因为图分类是先使用一个 r e a d o u t readout readout函数先得到图的一个embedding,我们记作 x x x,那么对于这个得到的 ( x i , y i ) , ( x j , y j ) (x_i,y_i),(x_j,y_j) (xi,yi),(xj,yj)直接套上面的公式就行。
  2. 节点分类:给定一个图 G G G,从这个图中取出一个节点对 ( i , j ) (i,j) (i,j),在GNN训练的过程中进行mixup,过程也很有意思,不赘述。
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
图像mixup是一种用于数据增强的技术,可以增加训练数据的多样性并提高模型的泛化能力。该技术主要通过将两个不同的图像进行混合来创建一个新的训练样本。 在使用Python实现图像mixup时,我们需要使用一些图像处理库和深度学习框架,比如OpenCV和Tensorflow或PyTorch。以下是一个简单的实现过程: 1. 导入必要的库和模块: ``` import cv2 import numpy as np import tensorflow as tf ``` 2. 定义一个函数来加载和处理图像: ``` def load_image(image_path): # 使用opencv加载图像 image = cv2.imread(image_path) # 将图像像素值归一化到0到1之间 image = image / 255.0 return image ``` 3. 定义一个函数来进行图像mixup: ``` def mixup(image1, image2, label1, label2, alpha=0.2): # 生成一个随机的mixup系数 lam = np.random.beta(alpha, alpha) # 使用mixup系数对图像和标签进行混合 mix_image = lam * image1 + (1 - lam) * image2 mix_label = lam * label1 + (1 - lam) * label2 return mix_image, mix_label ``` 4. 在训练过程中,使用mixup函数生成新的训练样本: ``` # 加载图像和标签 image1 = load_image("image1.jpg") image2 = load_image("image2.jpg") label1 = tf.one_hot(0, num_classes) label2 = tf.one_hot(1, num_classes) # 进行图像mixup mix_image, mix_label = mixup(image1, image2, label1, label2) # 将mixup生成的新样本用于训练 # ... ``` 通过实现图像mixup,我们可以扩充训练数据集,以增强模型对新图像的泛化能力,从而提高模型的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

canaryW

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值