深度学习
文章平均质量分 75
记录深度学习与深度增强学习的知识,算法,与工具
MengWoods
记录一些机器人相关的技术、数学、编程和人工智能相关数学、算法、工具、心得等。
展开
-
【DL】神经网络与机器学习基础知识介绍(二)【附程序】
原文:https://mengwoods.github.io/post/dl/009-dl-fundamental-2/原创 2024-08-03 05:15:22 · 680 阅读 · 0 评论 -
【DL】神经网络与机器学习基础知识介绍(一)
原博客:https://mengwoods.github.io/post/dl/009-dl-fundamental/原创 2024-07-29 04:38:28 · 840 阅读 · 0 评论 -
【RL】强化学习理论基础介绍
强化学习(RL)代表了机器学习领域的一个强大范式,灵感来自行为心理学,使得智能体能够在复杂环境中做出决策,以最大化累积奖励。作为马尔可夫决策过程(MDP)形式化,RL任务涉及状态、动作、奖励和转移概率。例如,深度 Q 网络(DQN)等算法利用深度神经网络高效逼近 Q 值,从而在离散动作空间中促进决策制定。基于价值的RL方法,例如DQN,通过估计状态-动作值来优化策略。演员-评论家方法改进了传统的策略梯度方法,引入评论家网络来估计值函数,从而减少方差并增强学习稳定性。原创 2024-07-07 16:13:10 · 670 阅读 · 0 评论 -
【其他】《神经网络与深度学习》(Michael Nielsen)1.6节完整程序解析
本程序完成手写数字(MNIST)识别# coding=utf-8"""network.py实现随机梯度下降学习的前馈神经网络算法,使用反向传播计算梯度。"""#### Libraries# Standard libraryimport random# Third-party librariesimport numpy as npclass Network(object): # 代原创 2017-04-06 11:00:35 · 1973 阅读 · 0 评论