欧氏距离和马尔可夫决策过程理解

yohoooooooooo

于 2023-01-22 23:47:48 发布

阅读量195

点赞数

分类专栏：机器学习笔记文章标签： numpy python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_63139411/article/details/128750318

版权

机器学习笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

欧几里得空间

定义了内积、距离、角

两个向量内积
余弦值
角
点距离

点距离代码

# 法一：
import numpy as np
A = np.array([3,4,5])
B = np.array([7,8,2])
c =np.linalg.norm(A-B)
c
#  6.4031242374328485

# 法二：
import math
def euclidean_distance(A,B):
    return math.sqrt(sum([(a-b)**2 for (a,b) in list(zip(A,B))]))
x = [3,4,5]
y = [7,8,2]
euclidean_distance(x,y)
# 6.4031242374328485

# 法三：
def ecu_dist(a,b):
    return np.sqrt(sum(np.power((a - b), 2)))
x1 = np.array([3,4,5])
y1 = np.array([7,8,2])
ecu_dist(x1,y1)
# 6.4031242374328485

注：zip()函数

a = [1,2,3,4,5]
b = [2,4,6,8,0]
a_b = list(zip(a, b))
a_b
# [(1, 2), (2, 4), (3, 6), (4, 8), (5, 0)]
print(list(zip(*a_b)))
# [(1, 2, 3, 4, 5), (2, 4, 6, 8, 0)]

马尔可夫决策（MDP）

要素包括：状态、动作、策略、奖励
一组交互对象（智能体和环境体）的互动：智能体感知系统状态，按照策略对环境体实现动作，从而改变环境体状态并获得奖励，奖励随时间积累被称为回报

在这里插入图片描述
马尔可夫决策过程图模型：

价值函数、动作价值函数：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
欧氏距离和马尔可夫决策过程理解

欧氏距离、马尔可夫决策过程（状态转移概率、价值函数、动作价值函数）
复制链接

扫一扫

专栏目录

yohoooooooooo CSDN认证博客专家 CSDN认证企业博客

码龄3年

14: 原创

112万+: 周排名

44万+: 总排名

5060: 访问

: 等级

163: 积分

6: 粉丝

5: 获赞

12: 评论

8: 收藏

私信

关注

热门文章

分类专栏

机器学习笔记 4篇

最新评论

AlexNet笔记
CSDN-Ada助手: 恭喜您写了第13篇博客《AlexNet笔记》！您的持续创作真令人钦佩。通过分享您对AlexNet的理解，您为读者提供了宝贵的知识。在下一步的创作中，或许您可以考虑分享一些关于AlexNet在实际应用中的案例，或者深入探讨一些与AlexNet相关的最新研究进展。期待您的下一篇博客！
FastRCNN学习笔记
CSDN-Ada助手: 恭喜您撰写了第14篇博客！阅读您的学习笔记，我对您的持续创作精神深感钦佩。在这篇博客中，您对FastRCNN的学习经验进行了分享，帮助读者更好地理解这个主题。接下来，我期待您在创作中能继续保持谦虚的态度，并且可能可以考虑探索其他深度学习领域的主题，以丰富读者们的知识。祝您在未来的创作中取得更多的成功！
yolov5使用笔记
CSDN-Ada助手: 恭喜您撰写第11篇博客！标题中提到的yolov5使用笔记引起了我的兴趣。您的持续创作令人钦佩，对于那些想要了解和使用yolov5的人们来说，您的博客无疑会是一份宝贵的资源。在接下来的创作中，或许您可以考虑分享一些关于yolov5的高级技巧或者实际应用案例，这将进一步丰富读者的知识。感谢您的付出，期待您未来更多优质内容的分享！
CNN汇报笔记1
CSDN-Ada助手: 恭喜您写了第12篇博客！标题为“CNN汇报笔记1”真是引人注目。您的持续创作值得赞赏，每篇博客都为读者们带来了新的见解。接下来，我建议您可以考虑探索一下CNN的应用领域，或者分享一些实际案例，这样读者们能更好地理解CNN的实际应用。谦虚地说，我期待着您下一篇博客的精彩内容！
C语言：变量的作用域与生命周期
想吃张鱼小丸子: 真～厉害啊（迷人气泡音）

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。