交互式机器学习/ 强化学习在图像领域中的应用

本文探讨了交互式机器学习如何在生物图像分析中提高效率,特别是在医学图像分割任务中,如CVPR2020的研究所示。同时,介绍了深度强化学习在该领域的应用。文章还区分了model-free与model-based强化学习的差异,以及on-policy和off-policy学习策略。此外,强调了这些技术在实际问题解决中的重要性。
摘要由CSDN通过智能技术生成

交互式机器学习

参考:

深度学习在交互式图像分割中的应用 - 知乎

Nat. Methods | ilastik:为生物图像分析而生的交互式机器学习平台_DrugAI-CSDN博客

https://d-nb.info/1183327005/34 (Interactive Object Detection)

CVPR 2020 | 利用强化学习进行交互式3D医学图像分割_zandaoguang的博客-CSDN博客

强化学习

参考:

基于强化学习的图像分割算法研究 - 百度学术

Deep Reinforcement Learning in Computer Vision: A Comprehensive Survey:

https://arxiv.org/pdf/2108.11510.pdf

强化学习在视觉上的应用(RL for computer Vision) - 知乎

深度强化学习在医学影像任务中的应用 - 知乎

**model-free 与 model-based的区别

Model指的是针对环境的建模,即输入Action,环境的响应:Reward和State。 Model-Free:环境对输入的响应就是一个映射,without model,如常见的深度强化学习DQN/A3C/PPO等; Model-Based:环境对输入的响应是统计概率分布P(s_new|s,a)及P(r|s,a),如动态规划等传统强化学习方法。

**on-policyoff-policy的区别

  • 如果要学习的 agent 跟和环境互动的 agent 是同一个的话, 这个叫做on-policy(同策略)
  • 如果要学习的 agent 跟和环境互动的 agent 不是同一个的话, 那这个叫做off-policy(异策略)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值