数学
文章平均质量分 92
从工程应用的角度解析一些线性代数,概率论,高等数学等知识
MengWoods
记录一些机器人相关的技术、数学、编程和人工智能相关数学、算法、工具、心得等。
展开
-
【RL】强化学习理论基础介绍
强化学习(RL)代表了机器学习领域的一个强大范式,灵感来自行为心理学,使得智能体能够在复杂环境中做出决策,以最大化累积奖励。作为马尔可夫决策过程(MDP)形式化,RL任务涉及状态、动作、奖励和转移概率。例如,深度 Q 网络(DQN)等算法利用深度神经网络高效逼近 Q 值,从而在离散动作空间中促进决策制定。基于价值的RL方法,例如DQN,通过估计状态-动作值来优化策略。演员-评论家方法改进了传统的策略梯度方法,引入评论家网络来估计值函数,从而减少方差并增强学习稳定性。原创 2024-07-07 16:13:10 · 716 阅读 · 0 评论 -
【数学】深度学习中的概率基础知识记录
概率论是表示不确定性陈述的数学框架。在AI领域中,我们以两种主要方式使用概率论。首先,概率定律告诉我们AI系统应该如何推理,因此我们设计算法来计算或近似使用概率论得出的各种表达式。其次,我们可以使用概率和统计来理论上分析所提出的AI系统的行为。原创 2024-04-20 02:05:22 · 567 阅读 · 0 评论 -
【数学】主成分分析(PCA)的应用案例解析(Python)
接着上文,本文介绍使用Python结合图像压缩案例解释PCA的具体实现流程,以了解数据处理的一些方法。原创 2024-04-18 01:30:21 · 1538 阅读 · 0 评论 -
【数学】主成分分析(PCA)的详细深度推导过程
现代数据集,如网络索引、高分辨率图像、气象学、实验测量等,通常包含高维特征,高纬度的数据可能不清晰、冗余,甚至具有误导性。数据可视化和解释变量之间的关系很困难,而使用这种高维数据训练的神经网络模型往往容易出现过拟合(维度诅咒)。主成分分析(PCA)是一种简单而强大的无监督机器学习技术,用于数据降维。它旨在从大型变量集中提取一个较小的数据集,同时尽可能保留原始信息和特征(有损压缩)。PCA有助于识别数据集中最显著和有意义的特征,使数据易于可视化。应用场景包括:统计学、去噪和为机器学习算法预处理数据。这些知识原创 2024-04-14 05:42:29 · 2175 阅读 · 0 评论 -
【数学】向量点乘、叉乘的理论、应用及代码实现(C++)
我总结了一下向量点乘,叉乘的概念,以及他们的应用及相关C++代码的实现。blog。原创 2024-04-07 07:10:59 · 1954 阅读 · 0 评论