马尔科夫型决策以及使用python计算方法

thehunters

已于 2022-06-08 17:55:10 修改

阅读量3.8k

点赞数 5

文章标签：概率论机器学习人工智能马尔科夫链

于 2022-05-31 10:52:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/thehunters/article/details/125059976

版权

本文介绍了马尔科夫性，解释了马尔科夫决策过程，并通过一个工厂机器状态的例子展示了如何利用Python计算马尔科夫链的转移概率矩阵。文章探讨了在不同决策方案下机器的收益情况，指出马尔科夫链的决策依赖于初始分布和转移概率矩阵。

摘要由CSDN通过智能技术生成

一、马尔可夫性

考察某工厂一台自动加工机的工作状态。该机器有两种工作状态：正常状态和故障状态。在每个整数钟点的起始时刻检查机器的工作情况，若机器处于正常状态，则让它继续工作；若机器处于故障状态，则对他进行检修。假设处于正常状态的机器，在1小时后发生故障的概率为0.05；处于故障状态的机器，在1小时内排除故障的概率0.6

显然任何时刻，机器只能处于正常状态或故障状态，我们分别用1和2表示这两种状态。

那么，这台机器在第n小时的状态Xn或者等于1，或者等于2，即Xn是仅取两个值的

离散型随机变量。我们关心的是Xn的随机变化规律。

由于处于正常状态的机器1小时后发生故障的概率为0.05，即

所以机器1小时后任处于正常状态的概率为

此时，X1的分布列由条件概率构成，这个分布列实际是已知X0=1的情况下X1的条件分布列

，用表格表示如下：

X1	1	2
P(.\|X0=1)	0.95	0.05

已知机器在第n小时处于故障状态，等价于事件{Xn=2}已经发生.此时在第n+1小时机器

处于第j(j=1,2)状态的概率是条件概率P(Xn+1=j|Xn=2).类似于前面的讨论，由故障机器

在1小时内被修复的概率为0.6，得

因此，若机器在第n小时处于故障状态，则Xn+1的条件分别列为

Xn+1	1	2
P(.\|Xn=2)

最低0.47元/天解锁文章

关注

5
点赞
踩
23

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄21年

129
原创

116
点赞

473
收藏

62
粉丝

关注

私信

热门文章

最新评论

windows meson ，ninja安装以及vs2017编译 libnice
wjwABCDEFG: pip install meson后，这个在哪个目录呀？我这里没有直接加入path，meson --version命令不存在
方向导数和梯度
showswoller: 写的很好很清晰对我很有帮助
梯度、散度与旋度
LiongLoure: 梯度解释的还可以，散度和旋度要是能更具体一点就好了
马尔科夫型决策以及使用python计算方法
JustDoit201906: [code=python] [/code] #文中代码更正： def MarkovChain(): P = torch.tensor([[0.95, 0.05], [0.9, 0.1]],dtype=torch.float) P1 = torch.tensor([[10], [-9]],dtype=torch.float) n = 7 for j in range(n): j=j+1 Init_State = torch.tensor([1, 0],dtype=torch.float) for i in range(j): S = matmul( Init_State, P) Init_State = S S = matmul(Init_State, P1) print(f'第{j}天收益分布：{S.T}')
ffmpeg 用于转换视频格式的各种命令行
thehunters: 考虑把字幕嵌入视频中，一劳永逸：ffmpeg -i infile.mp4 -i infile.srt -c copy -c:s mov_text outfile.mp4

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。