《数据挖掘》第二次实验
一、三门问题(Monty Hall problem),亦称为蒙提霍尔问题
三门问题(Monty Hall problem)亦称为蒙提霍尔问题、蒙特霍问题或蒙提霍尔悖论,大致出自美国的电视游戏节目Let’s Make a Deal。问题名字来自该节目的主持人蒙提·霍尔(Monty Hall)。
参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门可赢得该汽车,另外两扇门后面则各藏有一只山羊。
当参赛者选定了一扇门,但未去开启它的时候,节目主持人开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。
问题是:换另一扇门会否增加参赛者赢得汽车的机率?
注意此处规定了主持人必开山羊的门,而不是随手开任意一道门。
(1)从概率角度进行分析
假设A、B、C三扇门后面分别是山羊、山羊、汽车。
若参赛者开始选中的是后面有汽车的门C(概率为1/3)
,主持人打开后面有山羊的门B。这时参赛者如果换门,选中汽车的概率为1/3
∗
*
∗ 0=0;如果不换门,选中汽车的概率为1/3*1=1/3。
若参赛者开始选中的是后面有山羊的门A(概率为1/3)
,主持人打开后面有山羊的门B。这时参赛者如果换门,选中汽车的概率为1/3
∗
*
∗ 1=1/3;如果不换门,选中汽车的概率为1/3*0=0。
若参赛者开始选中的是后面有山羊的门B(概率为1/3)
,主持人打开后面有山羊的门A,这时参赛者如果换门,选中汽车的概率为1
∗
*
∗ 1/3=1/3;如果不换门,选中汽车的概率为1/3*0=0。
#概率角度
no_change=0
change=0
for i in range(1,4):
if i == 1:#car
change=change+0
no_change=no_change+1/3
elif i == 2:#sheepA
change = change + 1/3
no_change = no_change+0
elif i == 3:#sheepB
change = change + 1/3
no_change = no_change+0
print('换一扇门获得车的概率:',change,'\n不换门获得车的概率:',no_change)
(2)从蒙特卡洛思想上进行分析
import random
def play():
# 初始化三扇门
doors = ['car', 'sheep', 'sheep']
tv_choice = [0, 1, 2]
# 随机选择一扇门
your_choice = random.randint(0, 2)
tv_choice.remove(0)
if your_choice != 0:
tv_choice.remove(your_choice)
# 主持人打开一扇有山羊的门
open_door = np.random.choice(tv_choice)
# 改变选择
remaining_doors = [0, 1, 2]
remaining_doors.remove(your_choice)
remaining_doors.remove(open_door)
your_choice = remaining_doors[0]
# 判断最终结果
if doors[your_choice] == 'car':
return True
else:
return False
def simulate(epochs):
wins = 0
for _ in range(epochs):
if play():
wins += 1
probability = wins / epochs
return probability
# 模拟执行10000次,计算获胜概率
epochs = 10000
win_probability = simulate(epochs)
print("换门获得车的概率:", win_probability,"\n换门获得车的概率:", 1-win_probability)
二、一阶马尔科夫链模型(牛市熊市)
import numpy as np
class stock:
def __init__(self):
pass
def stock(self):
transition_probability = [[0.9,0.075,0.025],[0.15,0.8,0.05],[0.25,0.25,0.5]]
pi = [0.3,0.4,0.3]
for i in range(10):
pi = np.dot(pi,transition_probability)
#输出状态矩阵
print("最终概率矩阵为:"+str(pi))
if __name__ == '__main__':
stock=stock()
stock.stock()
三、隐马尔可夫模型
1、隐马氏模型的定义
隐马尔可夫模型(Hidden Markov Model,简称HMM)是可用于标注问题的统计学习模型,属于生成模型;
隐马尔可夫模型是结构最简单的动态贝叶斯网络,是一种有向图模型;
隐马尔可夫模型是关于时序的概率模型;
描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列(state sequence),再由各个状态生成一个观测而产生观测随机序列(observation sequence )的过程,序列的每一个位置又可以看作是一个时刻。
2、隐马氏模型的组成和基本假设
(1)组成
• 初始概率分布
• 状态转移概率分布
• 观测概率分布
• Q:所有可能状态的集合
• V:所有可能观测的集合
• I: 长度为T的状态序列
• O:对应的观测序列
• A:状态转移概率矩阵
• B:观测概率矩阵
• Π:初始状态概率向量
(2)三要素
lame=(A,B,Π)
(3)两个基本假设
齐次马尔科夫性假设,隐马尔可分链t的状态只和t-1状态有关。
观测独立性假设,观测只和当前时刻状态有关。