![](https://img-blog.csdnimg.cn/bf6ee555f5cd4db7a11536133a883ef4.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
人工智能
文章平均质量分 78
AI的学习
百度pkq
蒟蒻的训练家,有一只不会十万伏特、不会卖萌、不会装逼、只会百度的皮卡丘
展开
-
Matlab非深度学习口罩识别(待改进)
做课程设计,尝试别样的人脸口罩识别,做的也非常好,可是大部分源码都是封装在图形化界面.fig文件中,所以我只能根据思路来慢慢复现这些流程和功能,原创 2022-11-09 11:32:15 · 353 阅读 · 0 评论 -
强化学习--tf2.4 超级马里奥(super mario) PPO复现
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、安装库二、使用步骤总结前言我真的是醉了,刚开始无意间看到超级马里奥的强化学习,我就想学,然后。。。花了我零零散散一周的时间来从最初的Q_Learning,sarsa到高级的DQN,PG,DDPG再到最后的AC,A3C,PPO,我真的觉得没点看头,不知道学完之后能不能搞SuperMario,很不错,tf2.x的马里奥被我复现了。一、安装库之前学习的一直是Gym的环境,高级一点的游戏就是gym_super_mario.原创 2022-04-25 22:07:34 · 5736 阅读 · 3 评论 -
强化学习--PPO(完结)
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(PPO近端策略优化) Proximal Policy Optimization多线程版本的例子总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是原创 2022-04-24 19:50:12 · 8240 阅读 · 2 评论 -
强化学习--A3C
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(A3C) Asynchronous Advantage Actor-critic前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是原创 2022-04-24 19:27:59 · 936 阅读 · 0 评论 -
强化学习--Deep Deterministic Policy Gradient
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(深度强化学习)Deep Deterministic Policy GradientDDPG基于Actor_Critic中改善了啥呢?前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特原创 2022-04-24 15:28:36 · 2934 阅读 · 0 评论 -
强化学习--Policy Gradients
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(策略梯度法)Policy Gradients总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的原创 2022-04-23 21:29:05 · 254 阅读 · 0 评论 -
强化学习--Dueling DQN
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(深度强化学习)Dueline DQN总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的方式进行原创 2022-04-23 20:39:40 · 528 阅读 · 0 评论 -
强化学习--Prioritised Replay DQN
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(深度强化学习)Prioritised Replay DQN总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent原创 2022-04-23 20:28:13 · 430 阅读 · 0 评论 -
OpenAIGym环境
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心点(环境)安装方法用法:小车上坡的例子总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的方式进行学习原创 2022-04-23 16:42:04 · 1920 阅读 · 0 评论 -
强化学习--DQN
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(深度强化学习) DQN1.什么是DQN?总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的方式原创 2022-04-18 10:45:44 · 1446 阅读 · 0 评论 -
强化学习--Sarsa
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(免模型学习) Sarsa1.学习心得前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试错”的方式进行学习原创 2022-04-18 10:21:27 · 524 阅读 · 0 评论 -
强化学习--QLearning
系列文章目录强化学习提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、强化学习是什么?二、核心算法(免模型学习) QLearning1.未记录学习心得总结前言强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。一、强化学习是什么?强化学习是智能体(Agent)以“试原创 2022-04-18 09:38:01 · 593 阅读 · 0 评论 -
win11下安装子系统Ubuntu(翻车名场面)
项目场景:项目场景:由于想继续搞深度学习,然后配了个30系列的显卡,在win11下搞了一通tensorflow之后发现无法兼容低版本的tensorflow-gpu,但是听说Linux下可以跑,所以有三个选择,双系统,虚拟机,子系统。因为子系统比较新鲜,我想尝试下(在系统应用商店中搜索Ubuntu,很早之前使用的是16.04的虽然现在又20的了但是我还是选择了18,希望变动不大)问题描述提示:这里描述项目中遇到的问题:第一个错误Installing, this may take a few m原创 2022-04-16 15:25:37 · 7611 阅读 · 5 评论 -
Tensorflow2.4.0配置cuda11.2 gpu成功跑通
问题描述前面因为cuda10以及Tensorflow版本的问题,所以都配置了高版本,终于可以启动GPU了出现问题:安装的时候出现错误(出现错误时没来得及截图)NVIDIA Setup cannot continue. You have installed a newer version of the NVIDIA frameview SDK.当时以为自己不小心删除了什么重要驱动程序,还想着去Nvidia官网下驱动包的,后面仔细理解了这个意思,好像是多了啥,然后去卸载了NVIDIA framev原创 2022-04-16 14:50:55 · 1118 阅读 · 0 评论 -
3050ti跑tensoflow-gpu,屡次碰壁,总结原因如下
项目场景:例如:新电脑到了,配置是3050ti 4G 其他参数都是比较平均的,安装好基础软件之后,上深度学习。问题描述在挣扎后回忆起怎么安装显卡驱动了,看到配置版本tf2.0配的cuda是10.0,cudnn是7.4,安装成功后的显示情况:(可以看到cuda是10.0,我显卡驱动限制版本是11.4,原则上是不高于显卡限制)nvcc -Vnvcc: NVIDIA (R) Cuda compiler driverCopyright (c) 2005-2018 NVIDIA Corporation原创 2022-04-16 13:22:49 · 3273 阅读 · 5 评论