- 博客(2)
- 收藏
- 关注
原创 强化学习学习总结
ⅠValue Iteration:是一种求解最优策略的方法,价值迭代的算法思想是:遍历 环境中的每一个状态,在每一个状态下,依次执行每一个可以执行的动作,算 出执行每一个动作后获得的奖励,即状态-动作价值,当前状态的价值即为当 前状态下的最大状态-动作价值。因此,我们发现了,蒙特卡洛采样是对问题的估算,而不是精确计算,这是MC的优势,但是也代表了如果使用的模型模拟不精准,数据不准确,会导致非常巨大的错误。),简而言之,就是事件发生的整个过程,每个时刻的状态只和该时刻的上个时刻的状态有关。
2024-04-25 15:47:38 874 1
原创 文献阅读--基于深度卷积集成网络的视网膜多种疾病筛查和识别方法
深层卷积神经网络可以自动完成特征提取,并取得更好的效果,本文将谷歌大脑团队提出的 EfficientNet作为模型的主干网络部分进行特征提取,该网络可对网络的深度、宽度和输入的分辨率进行适当的调整,以达到更好的特征提取效果。X为输入的视网膜眼底图像,Y为相应图像的标签,f(*)为主干网络对图像信息编 码后预测为正类的概率,N为疾病类别数量,σ(*)为Sigmoid函数,α和β为超 参数,用于平衡两个任务损失函数所占比重。最后,多个网络模型进行集成,并将最终的结果用于疾病筛查和识别。
2023-12-18 12:43:22 830 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人