UNet语义分割实战：使用UNet实现对人物的抠图，Python面试项目上的难点

最新推荐文章于 2024-05-10 05:03:23 发布

m0_61067876

最新推荐文章于 2024-05-10 05:03:23 发布

阅读量362

点赞数 5

分类专栏： 2024年程序员学习文章标签： python 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61067876/article/details/137098110

版权

本文介绍了如何使用UNet在Python中进行语义分割，特别是针对人物抠图任务。关键步骤包括数据集划分、DataLoader创建、模型训练参数设置、优化器、损失函数的选择以及wandb的可视化。文中详细阐述了参数如epochs、batch-size和learning-rate的重要性，并提供了训练和预测的代码示例。

摘要由CSDN通过智能技术生成

def get_args():

parser = argparse.ArgumentParser(description=‘Train the UNet on images and target masks’)

parser.add_argument(‘–epochs’, ‘-e’, metavar=‘E’, type=int, default=300, help=‘Number of epochs’)

parser.add_argument(‘–batch-size’, ‘-b’, dest=‘batch_size’, metavar=‘B’, type=int, default=16, help=‘Batch size’)

parser.add_argument(‘–learning-rate’, ‘-l’, metavar=‘LR’, type=float, default=0.001,

help=‘Learning rate’, dest=‘lr’)

parser.add_argument(‘–load’, ‘-f’, type=str, default=False, help=‘Load model from a .pth file’)

parser.add_argument(‘–scale’, ‘-s’, type=float, default=0.5, help=‘Downscaling factor of the images’)

parser.add_argument(‘–validation’, ‘-v’, dest=‘val’, type=float, default=10.0,

help=‘Percent of the data that is used as validation (0-100)’)

parser.add_argument(‘–amp’, action=‘store_true’, default=False, help=‘Use mixed precision’)

return parser.parse_args()

epochs：epoch的个数，一般设置为300。

batch-size：批处理的大小，根据显存的大小设置。

learning-rate：学习率，一般设置为0.001，如果优化器不同，初始的学习率也要做相应的调整。

load：加载模型的路径，如果接着上次的训练，就需要设置上次训练的权重文件路径，如果有预训练权重，则设置预训练权重的路径。

scale：放大的倍数，这里设置为0.5，把图片大小变为原来的一半。

validation：验证验证集的百分比。

amp：是否使用混合精度？

比较重要的参数是epochs、batch-size和learning-rate，可以反复调整做实验，达到最好的精度。

接下来是设置模型：

net = UNet(n_channels=3, n_classes=2, bilinear=True)

logging.info(f’Network:\n’

f’\t{net.n_channels} input channels\n’

f’\t{net.n_classes} output channels (classes)\n’

f’\t{“Bilinear” if net.bilinear else “Transposed conv”} upscaling’)

if args.load:

net.load_state_dict(torch.load(args.load, map_location=device))

logging.info(f’Model loaded from {args.load}')

设置UNet参数，n_channels是imgs图片的通道数，如果是rgb则是3，如果是黑白图片就是1，n_classes设置为2，在这里把背景也当做一个类别，所以有两个类。

如果设置了权重文件，则加载权重文件，加载权重文件做迁移学习可以加快训练，减少迭代次数，所以如果有还是尽量加载预训练权重。

接下来修改train_net函数的逻辑。

try:

dataset = CarvanaDataset(dir_img, dir_mask, img_scale)

except (AssertionError, RuntimeError):

dataset = BasicDataset(dir_img, dir_mask, img_scale)

2. Split into train / validation partitions

n_val = int(len(dataset) * val_percent)

n_train = len(dataset) - n_val

train_set, v

最低0.47元/天解锁文章

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。