人工智能
文章平均质量分 79
人工智能
流荧静水
这个作者很懒,什么都没留下…
展开
-
启发式搜索(简单易懂版)
希望用最容易理解的话讲清楚启发式算法原创 2022-11-29 13:02:41 · 590 阅读 · 0 评论 -
李宏毅机器学习Homework1(代码简洁版)
李宏毅机器学习Homework1题意大概是(我具体没怎么听,觉得有问题的小伙伴可以提醒我一句),给你前四天的数据,根据第5天的身体状况预测第五天的test_positive,具体数据b站有,懒得放了因为电脑没有GPU所以我懒得管那些GPU的设置了,然后代码主要是训练模块,测试模块实际上就是把网络设置成推理模式,然后自己跑,很简单的我就不写了这个问题单纯是练手的,我也没看老师的代码是怎么做的,反正训练效果我感觉差不多就行了,就不多说废话,调整超参数那些自己可以尝试搞一搞import torchi原创 2022-05-04 14:22:40 · 853 阅读 · 0 评论 -
深度强化学习(DRL)学习笔记(随缘更新,已更新完第6章双Q学习)
文章目录本次前言第五章 SARSA算法表格形式的SARSA(State-Action-Reward-State-Action)SARSA和Q学习对比神经网络形式的SARSA多部TD目标本次前言1-4章第五章 SARSA算法SARSA的目的是学习动作价值函数Qπ(s,a)Q_\pi(s,a)Qπ(s,a),现在QπQ_\piQπ通常被用于评价策略的好坏,而非控制智能体,QπQ_\piQπ(Critic裁判)常与策略函数π\piπ(Actor演员)结合使用,被称作Actor-Critic方法原创 2022-03-27 11:38:50 · 990 阅读 · 0 评论 -
深度强化学习(DRL)学习笔记(1 - 4章)
前言该学习笔记源于王树森、张志华教授的《深度强化学习》目前因为毕业设计,暂时学习到第10章(DDPG网络),我刚学(深度强化学习)DRL刚开始,我觉得我学得很乱,其中一个重要原因就是我基本上对各种符号很生疏,因此大家浏览的时候能够重点记忆常用符号这是我第三次浏览,希望能够通过前两次的学习经验,整理有用的DRL笔记帮助大家常用符号(后面因为懒得打英文了,而且用的也不多,直接开摆)符号中文英文S or sS~or~sS or s状态原创 2022-03-25 23:24:06 · 995 阅读 · 0 评论