人工智能
文章平均质量分 94
人工智能相关知识
晴空~
又菜又爱玩!
展开
-
【RL】Actor-Critic Methods
概述强化学习中的Actor-Critic Methods原创 2024-02-22 17:41:54 · 804 阅读 · 0 评论 -
【RL】Policy Gradient Methods(策略梯度方法)
概述强化学习算法中策略梯度方法。原创 2024-02-21 17:36:49 · 907 阅读 · 0 评论 -
【RL】Value Function Approximation(值函数逼近)
从无到有的简述强化学习算法中的deep q-learning的实现原创 2024-02-20 17:11:10 · 1009 阅读 · 0 评论 -
【RL】Temporal-Difference Learning(时序差分方法)
简述强化学习中时序差分算法原创 2024-02-19 19:42:47 · 776 阅读 · 0 评论 -
【RL】Monte Carlo Learning(蒙特卡洛学习)
介绍强化学习中model-free的蒙特卡洛学习算法原创 2024-02-18 16:11:00 · 827 阅读 · 0 评论 -
【RL】Value Iteration and Policy Iteration(利用迭代算法求解贝尔曼最优等式)
简述计算贝尔曼最优等式的迭代求解算法原创 2024-02-17 16:42:48 · 742 阅读 · 0 评论 -
【RL】Bellman Optimality Equation(贝尔曼最优等式)
解释强化学习中的贝尔曼最优公式原创 2024-02-14 21:39:24 · 1082 阅读 · 0 评论 -
【RL】Bellman Equation (贝尔曼等式)
解释强化学习中贝尔曼公式原创 2024-02-07 15:35:13 · 1920 阅读 · 0 评论 -
【RL】Basic Concepts in Reinforcement Learning
解释强化学习术语的基本概念原创 2024-02-06 22:13:35 · 646 阅读 · 0 评论 -
NLP领域模型对抗攻击简介
攻击NLP模型方法的简单总结原创 2023-08-08 18:26:52 · 2020 阅读 · 0 评论 -
评估分类模型—混淆矩阵Confusion Matrix与评估指标
对于设计好的分类模型,需要大量的数据集来对其性能进行评估,因此了解评估指标是十分重要的。原创 2023-05-11 12:16:14 · 4753 阅读 · 0 评论 -
图嵌入表示学习—Graph Embeddings
图嵌入表示学习、图学习、图原创 2023-05-07 18:27:29 · 1056 阅读 · 0 评论 -
图嵌入表示学习—Node Embeddings随机游走
图神经网络、随机游走、图嵌入原创 2023-05-06 22:41:15 · 829 阅读 · 0 评论 -
SORT与DeepSORT简介
DeepSORT作为一个成熟多目标跟踪算法在很多应用中得到使用。本文对多目标跟踪算法SORT与DeepSORT做简要介绍。原创 2023-02-20 18:26:22 · 2765 阅读 · 0 评论 -
YOLOv5简介
YOLOv5是十分受欢迎的目标检测网络,了解其设计的原理与细节对理解计算机视觉有着很大的好处。原创 2023-02-17 19:54:13 · 11245 阅读 · 1 评论 -
YOLOv3简介
YOLOv3作为出色的目标检测函数受到了广泛的好评,同时为后续的YOLO系列打下了基础。原创 2023-02-16 14:37:40 · 1272 阅读 · 0 评论 -
InstructGPT——ChatGPT前身
从ChatGPT”方法“原文可以看出,其使用的网络模型来自GPT-3.5,其原始模型在2022年已经训练完成,之后使用InstructGPT中的方法进行微调。 鉴于ChatGPT的论文还没有发表,故了解InstructGPT的实现对理解ChatGPT大有帮助。原创 2023-02-15 17:54:20 · 3680 阅读 · 0 评论 -
GPT-3(Language Models are Few-shot Learners)简介
GPT-2与GPT-3简介,包括其架构组成与设计理念原创 2023-02-15 14:05:00 · 2877 阅读 · 0 评论 -
Transformer简介
transformer模型简介,包括编码器(encoder)、解码器(decoder)、训练以及模型训练中的tips。原创 2023-02-13 15:21:57 · 8834 阅读 · 2 评论 -
BERT简介
对BERT做简要的介绍原创 2023-02-10 16:22:17 · 1291 阅读 · 0 评论 -
深度学习优化算法总结
优化提供了一种最大消毒减少深度学习损失函数的方法,但本质上,优化和深度学习的目标不同。优化关注的是最小化目标;深度学习是在给定有限数据量的情况下寻找合适的模型。本文包含:梯度下降、随机梯度下降、小批量随机梯度下降、动量法、AdaGrtad法、RMSProp法、Adaelta法和Adam算法。原创 2023-02-09 14:53:14 · 1177 阅读 · 0 评论