《数据挖掘》第二次实验

幻兒

已于 2023-06-20 21:48:00 修改

阅读量213

点赞数 2

分类专栏：数据挖掘文章标签：数据挖掘 python 人工智能

于 2023-04-08 17:49:48 首次发布

本文链接：https://blog.csdn.net/m0_57196321/article/details/130029999

版权

数据挖掘专栏收录该内容

14 篇文章 0 订阅

订阅专栏

《数据挖掘》第二次实验

一、三门问题（Monty Hall problem），亦称为蒙提霍尔问题
- （1）从概率角度进行分析
- （2）从蒙特卡洛思想上进行分析
二、一阶马尔科夫链模型（牛市熊市）
三、隐马尔可夫模型

一、三门问题（Monty Hall problem），亦称为蒙提霍尔问题

三门问题（Monty Hall problem）亦称为蒙提霍尔问题、蒙特霍问题或蒙提霍尔悖论，大致出自美国的电视游戏节目Let’s Make a Deal。问题名字来自该节目的主持人蒙提·霍尔（Monty Hall）。
参赛者会看见三扇关闭了的门，其中一扇的后面有一辆汽车，选中后面有车的那扇门可赢得该汽车，另外两扇门后面则各藏有一只山羊。
当参赛者选定了一扇门，但未去开启它的时候，节目主持人开启剩下两扇门的其中一扇，露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。
问题是：换另一扇门会否增加参赛者赢得汽车的机率？
注意此处规定了主持人必开山羊的门，而不是随手开任意一道门。

（1）从概率角度进行分析

假设A、B、C三扇门后面分别是山羊、山羊、汽车。

若参赛者开始选中的是后面有汽车的门C（概率为1/3），主持人打开后面有山羊的门B。这时参赛者如果换门，选中汽车的概率为1/3 $*$ 0=0；如果不换门，选中汽车的概率为1/3*1=1/3。

若参赛者开始选中的是后面有山羊的门A（概率为1/3），主持人打开后面有山羊的门B。这时参赛者如果换门，选中汽车的概率为1/3 $*$ 1=1/3；如果不换门，选中汽车的概率为1/3*0=0。

若参赛者开始选中的是后面有山羊的门B（概率为1/3），主持人打开后面有山羊的门A，这时参赛者如果换门，选中汽车的概率为1 $*$ 1/3=1/3；如果不换门，选中汽车的概率为1/3*0=0。

#概率角度
no_change=0
change=0
for i in range(1,4):
    if i == 1:#car
        change=change+0
        no_change=no_change+1/3
    elif i == 2:#sheepA
        change = change + 1/3
        no_change = no_change+0
    elif i == 3:#sheepB
        change = change + 1/3
        no_change = no_change+0
print('换一扇门获得车的概率:',change,'\n不换门获得车的概率:',no_change)

在这里插入图片描述

（2）从蒙特卡洛思想上进行分析

import random

def play():
    # 初始化三扇门
    doors = ['car', 'sheep', 'sheep']
    tv_choice = [0, 1, 2]

    # 随机选择一扇门
    your_choice = random.randint(0, 2)

    tv_choice.remove(0)
    if your_choice != 0:
        tv_choice.remove(your_choice)

    # 主持人打开一扇有山羊的门
    open_door = np.random.choice(tv_choice)

    # 改变选择
    remaining_doors = [0, 1, 2]
    remaining_doors.remove(your_choice)
    remaining_doors.remove(open_door)
    your_choice = remaining_doors[0]

    # 判断最终结果
    if doors[your_choice] == 'car':
        return True
    else:
        return False

def simulate(epochs):
    wins = 0
    for _ in range(epochs):
        if play():
            wins += 1

    probability = wins / epochs
    return probability

# 模拟执行10000次，计算获胜概率
epochs = 10000
win_probability = simulate(epochs)
print("换门获得车的概率:", win_probability,"\n换门获得车的概率:", 1-win_probability)

在这里插入图片描述

二、一阶马尔科夫链模型（牛市熊市）

import numpy as np

class stock:
    def __init__(self):
        pass
    def stock(self):
        transition_probability = [[0.9,0.075,0.025],[0.15,0.8,0.05],[0.25,0.25,0.5]]
        pi = [0.3,0.4,0.3]
        for i in range(10):
            pi = np.dot(pi,transition_probability)
            #输出状态矩阵
            print("最终概率矩阵为:"+str(pi))

if __name__ == '__main__':
    stock=stock()
    stock.stock()

在这里插入图片描述

三、隐马尔可夫模型

1、隐马氏模型的定义

隐马尔可夫模型(Hidden Markov Model,简称HMM)是可用于标注问题的统计学习模型，属于生成模型;
隐马尔可夫模型是结构最简单的动态贝叶斯网络，是一种有向图模型;
隐马尔可夫模型是关于时序的概率模型;
描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列(state sequence)，再由各个状态生成一个观测而产生观测随机序列(observation sequence )的过程,序列的每一个位置又可以看作是一个时刻。