欧几里得空间
定义了内积、距离、角
-
两个向量内积
-
余弦值
-
角
-
点距离
点距离代码
# 法一:
import numpy as np
A = np.array([3,4,5])
B = np.array([7,8,2])
c =np.linalg.norm(A-B)
c
# 6.4031242374328485
# 法二:
import math
def euclidean_distance(A,B):
return math.sqrt(sum([(a-b)**2 for (a,b) in list(zip(A,B))]))
x = [3,4,5]
y = [7,8,2]
euclidean_distance(x,y)
# 6.4031242374328485
# 法三:
def ecu_dist(a,b):
return np.sqrt(sum(np.power((a - b), 2)))
x1 = np.array([3,4,5])
y1 = np.array([7,8,2])
ecu_dist(x1,y1)
# 6.4031242374328485
注:zip()函数
a = [1,2,3,4,5]
b = [2,4,6,8,0]
a_b = list(zip(a, b))
a_b
# [(1, 2), (2, 4), (3, 6), (4, 8), (5, 0)]
print(list(zip(*a_b)))
# [(1, 2, 3, 4, 5), (2, 4, 6, 8, 0)]
马尔可夫决策(MDP)
- 要素包括:状态、动作、策略、奖励
- 一组交互对象(智能体和环境体)的互动:智能体感知系统状态,按照策略对环境体实现动作,从而改变环境体状态并获得奖励,奖励随时间积累被称为回报
马尔可夫决策过程图模型:
- 价值函数、动作价值函数: