深度学习
文章平均质量分 93
微笑小星
强化学习的信仰者,游戏开发的爱好者。
展开
-
offline强化学习之Revive SDK的使用
Revive 用于构建仅基于离线数据的智能决策系统。离线强化学习,即在不与环境进一步交互的情况下从固定数据集中学习的任务,构成了 Revive 的核心。它有望将历史数据集转变为强大的决策引擎。离线强化学习方法探索了从现有数据中提取具有最大效用的策略的可能性,从而使许多关键决策领域的策略优化过程自动化,从机械系统的优化控制,提高能源部门的能源效率,到更广泛的影响促进科学研究。原创 2022-02-11 12:11:00 · 4036 阅读 · 3 评论 -
WSL2端配置pytorch GPU加速环境
配置好WIn10的Linux子系统WSL2的GPU加速深度学习,我踩坑踩得头皮发麻原创 2022-01-25 21:06:39 · 5848 阅读 · 2 评论 -
论文阅读:Variational Discriminator Bottleneck
对判别器进行信息约束来达到更为稳定的生成对抗训练原创 2021-12-24 12:41:50 · 2552 阅读 · 0 评论 -
pytorch实战教学(一篇管够)
参考B站视频使用更佳:https://www.bilibili.com/video/BV1Y7411d7Ys?p=5&spm_id_from=pageDriver个人博客:https://tianjuewudi.gitee.io/PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。它是一个基于Python的可续计算包,提供两个高级功能:1、具有强大的GPU加速的张量计算(如NumPy)。2、包含自动求导系统的深度神经网络。PyTorch和TensorF原创 2021-05-26 11:18:01 · 17080 阅读 · 8 评论 -
神经网络压缩
视频教程链接:https://www.bilibili.com/video/BV1Wv411h7kN?p=86本文的内容主要讲解如何压缩一个较为庞大的神经网络,使其在较少参数的情况下,拥有和原来差不多的效能。这是因为在一些场景中,例如智能手表,它的内存是有限的,如果模型太过庞大,会导致无法运行在这样的小型智能物件上。下面来介绍五个常用做法:Network Pruning顾名思义,我们可以对神经网络进行修剪,树大必有枯枝。因此我们可以把没有用的参数找出来扔掉。确定参数重要性的方法有多种,我们可以把绝原创 2021-07-15 17:31:23 · 738 阅读 · 1 评论