04-贝叶斯概率

最新推荐文章于 2024-07-22 22:54:47 发布

小帆-Matter

最新推荐文章于 2024-07-22 22:54:47 发布

阅读量382

点赞数

分类专栏： Prml

本文链接：https://blog.csdn.net/matter605924657/article/details/52430702

版权

Prml 专栏收录该内容

11 篇文章 1 订阅

订阅专栏

频率论和贝叶斯论
- 频率论
- 贝叶斯论
似然函数
- 最大似然maximum likelihood
- 自助法bootstrap

频率论和贝叶斯论

频率论

频率论的概率：事件A在独立重复试验中发生的频率趋于极限p，那么这个极限就是该事件的概率。

频率论观点：通过重复随机事件的发生的频率来考察概率。

贝叶斯论

贝叶斯（Bayesian）观点：量化描述了频率的不确定性。

贝叶斯的观点：能够使用概率论的机制，描述模型参数 $w$ 或模型选择的不确定性。

例如：盒子中的水果的例子，水果种类的确定，为选择红盒的概率提供了相关的信息。

贝叶斯定理通过观测到的数据提供的证据，把先验概率转化为了后验概率。
进行数量的推断，如：多项式曲线拟合中的参数 w ，可以采用同样的方法。

贝叶斯定理的公式：

p(w|D)=p(D|w)p(w)p(D)

在观测数据之前，以先验概率 $p(w)$ 的形式给出了，一些关于参数 $w$ 的假设。观测到的数据 $D=t1,...,tn$ 的影响，是通过条件概率 $p(D|w)$ 来表达的

可以根据观测到 $D$ 后的后验概率 $p(w|D)$ 来估计 $w$ 的不确定性。

似然函数

贝叶斯定理右侧的量 $p(D|w)$ 由观测到的数据集 $D$ 来估计，可以被看成参数向量 $w$ 的似然函数（likelihood function）。

不同的参数向量 $w$ 的情况下，观测到的数据集的可能性

在贝叶斯和频率论观点中，似然函数 $p(D|w)$ 都起着重要作用。然而，在这两种观点中它的使用方式有着本质的不同。

频率论的观点中， $w$ 被当作固定的参数，它的值是由某种形式的估计来确定的，这个估计误差是由可能的数据集 $D$ 分布来确定的。
贝叶斯观点下中，只有一个数据集 $D$ (即实际观测到的数据集) ，参数的不确定性是通过 $w$ 的概率分布来表示的。

最大似然（maximum likelihood）

最大似然（maximum likelihood）是频率论广泛使用的一种估计，其中 $w$ 取使似然函数 $p(D|w)$ 达到最大值的值，也就是使 $w$ 的值等于使观察到的数据集出现的概率最大的值。

似然函数的负对数被称为误差函数（error function）。因为负对数是一个单调递减的函数，最大化似然函数也就是最小化误差。

自助法（bootstrap）

自助法（bootstrap）是频率论中一种决定误差的方法

创造多个数据集：假设我们的原始数据集包含 $N$ 个数据点 $X=x_1,...,x_N$ 。

我们可以通过随机的从 $X$ 中取 $N$ 个数据来创建数据集 $X_B$ 。
选取是可以重复的，所以有些 XX 中的点可能在 $X_B$ 中出现多次，而有些可能不出现。
这样的过程可以重复 $L$ 次，得到 $L$ 个大小为 $N$ 的通过对原数据集 $X$ 采样得到的数据集。
参数估计的统计精确度就可以通过考察不同的自助数据集之间的预测变异性来进行评估。

确定要放弃本次机会？
福利倒计时
: :

立减 ¥
普通VIP年卡可用
立即使用

小帆-Matter

关注关注

0
点赞

踩

0

收藏

觉得还不错? 一键收藏

0
评论

复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

贝叶斯决策理论之入门篇

碧落回雪的博客

09-11 9136

贝叶斯定理首先是条件概率公式如下： P(A|B)=P(B|A)P(A)P(B)P(A|B)=P(B|A)P(A)P(B)P(A|B)=\frac {P(B|A)P(A)}{P(B)} 为了方便理解，可以参考下图已知两个独立事件AAA和BBB，那么事件BBB发生的前提下，事件AAA发生的概率可以表示为P(A|B)P(A|B)P(A|B)，即上图中橙色部分占红色部分的...

贝叶斯线性回归（Bayesian Linear Regression）

热门推荐

Daunxx的专栏

06-21 9万+

在很多的机器学习或数据挖掘的问题中，我们所面对的只有数据，但数据中潜在的概率密度函数是不知道的，其概率密度分布需要我们从数据中估计出来。想要确定数据对应的概率密度分布，就需要确定两个东西：**概率密度函数的形式** 和 **概率密度函数的参数**。

参与评论您还未登录，请先登录后发表或查看评论

贝叶斯推断简介

Jie Qiao的专栏

09-22 8772

这篇文章将带你在高处俯瞰贝叶斯的风景。世界是确定的还是随机的？或许穷尽一生我也无法找到答案，但这并不妨碍我们去领略这两个世界风景啊。频率学派认为参数是一个确定的常数，而贝叶斯则认为参数是一个随机变量，本文要讲的正是使用贝叶斯推断的方法，在这不确定的世界中探索。

数据挖掘(5.1)--贝叶斯分类

码银的博客

05-28 4028

贝叶斯分类方法是统计学的分类方法,它利用概率统计知识预测给定元组属于特定类的概率。贝叶斯分类基于贝叶斯定理。最简单的贝叶斯分类算法称为朴素贝叶斯分类法。

概率图-表示-贝叶斯网络

宁悦的博客

12-07 2182

一、贝叶斯网例子 贝叶斯网是一种经典的概率图模型，它利用有向无环图来刻画属性之间的依赖关系。首先来看一个的例子，一个学生想要请求教授为其写一封推荐信，推荐信的质量用变量L表示，取值范围为{是,否}。而教授健忘不知道这个学生的名字，所以要查看学生的成绩来确定是否为其写推荐信。学生成绩的取值范围为{A,B,C}，分别对应于g1,g2,g3，而考试的成绩和试题的难度还有智商有关系，他们的取值范围都...

MATLAB---贝叶斯算法

临风暖阳的博客

04-17 3776

clear; clc; N=29;w=4;n=3;N1=4;N2=7;N3=8;N4=10; A=[864.45 877.88 1418.79 1449.58;1647.31 2031.66 1775.89 1641.58;2665.9 3071.18 2772.9 3045.12]; % A belongs to w1 B=[2352.12 2297.28 2092.62 2205.36 2949.16 2802.88 2063.54 2557.04 3340.14 3177.21 324.

talbay---贝叶斯网络分析工具产品介绍

plstudio1的博客

11-17 1657

talbay是拥有独立知识产权的国产软件，主要功能是贝叶斯网络建模、决策网络建模、概率计算、决策支持、敏感性分析、网络模型验证、机器学习等。talbay以用户为中心，简单易用, 计算准确高效，分析全面多样，在应用成熟理论及算法的基础上，持续融合贝叶斯网络分析领域的最新研究成果以及自研成果。talbay是一款既能够满足工程应用，又能够辅助科研探索的贝叶斯网络分析工具。

Python机器学习笔记04--贝叶斯分类实战

MARS_098的博客

01-29 1271

Python机器学习笔记01--机器学习基础 Python机器学习笔记02--Scikit-learn库 Python机器学习笔记03--线性回归预测实战本文索引：分类基本概念 贝叶斯分类概述垃圾邮件分类实战一、分类基本概念【什么是分类】生活中常见的分类诸如超市物品分类（面包、鲜肉、蔬菜等）、垃圾分类（餐余垃圾、有害垃圾、其他垃圾、可回收物）和生活信息分类（房...

task5----贝叶斯分类

最新发布

2301_79707153的博客

07-22 992

分类算法常用的有很多种，朴素贝叶斯算法是其中一个比较常用的，之所以称为朴素贝叶斯算法主要是因为该算法最基本的原理是基于贝叶斯定理的，称为朴素是因为该算法成立的前提是特征之间必须得是独立的。朴素贝叶斯（Naive Bayes）算法理论基础是基于贝叶斯定理和条件独立性假设的一种分类方法。

机器学习--贝叶斯网

Elvis__c的博客

08-11 1392

[代码]基于西瓜问题的一种贝叶斯网结构和属性"根蒂"的条件概率表从图中网络结构可看出色泽" 直接依赖于 "好瓜 “和"甜度”，而"根蒂"则直接依赖于"甜度"进一步从条件概率表能得到"根蒂"对"甜度"量化依赖关系?贝叶斯网络（BN）是一种概率图形模型，用于在医学，生物学，流行病学，经济和社会科学等各个领域的不确定性下进行推理。在癌症DAG中，“污染”和“吸烟者”是“癌症”的父母，他们也被称为“癌症”的直接原因。的关系，例如，“污染”和“吸烟者”是独立的，“吸烟者”和“癌症”是依赖的。......

5-贝叶斯算法.7z5-贝叶斯算法.7z

07-03

贝叶斯算法是一种基于概率论的统计学习方法，它的核心思想是通过贝叶斯定理来更新先验知识，从而得到后验概率。在机器学习领域，贝叶斯算法广泛应用于分类、回归、推荐系统、文本分类、垃圾邮件过滤等多个场景。 ...

计算机视觉-贝叶斯学习MATLAB源码

04-05

贝叶斯分类算法是统计学的一种分类方法，它是一类利用概率统计知识进行分类的算法。在许多场合，朴素贝叶斯(Naïve Bayes，NB)分类算法可以与决策树和神经网络分类算法相媲美，该算法能运用到大型数据库中，而且方法...

Python-贝叶斯思维第二版文本代码

08-11

贝叶斯统计是一种概率推理方法，它以托马斯·贝叶斯的名字命名，其核心在于通过先验概率和似然性更新我们的信念或假设。在机器学习中，贝叶斯方法被广泛应用于分类、回归、特征选择和模型选择等任务，如朴素贝叶斯...

丁彦霞---贝叶斯1

08-08

贝叶斯公式，源于18世纪英国数学家托马斯·贝叶斯的工作，是一种概率推理方法，通过结合新证据来更新对某一假设的信念。公式由法国数学家拉普拉斯进一步发展，表达为：P(A|B) = P(B|A) * P(A) / P(B)，其中P(A|B)是...

模式识别-贝叶斯matlab实例_贝叶斯_贝叶斯实例_贝叶斯matlab_模式识别_matlab_

10-01

贝叶斯理论是统计学中一种基于概率的推理方法，它在机器学习和人工智能中有广泛应用。 贝叶斯定理是贝叶斯理论的核心，它描述了在给定一些相关证据（观察数据）的情况下，关于假设（模型）的后验概率如何更新。在...

07-贝叶斯曲线拟合

小帆自留地

09-06 5621

贝叶斯方法

03-期望和协方差

小帆自留地

09-04 1217

期望和协方差

06-最大后验估计

小帆自留地

09-05 931

从贝叶斯的角度，观察和认识误差函数和正则化

05-高斯分布

小帆自留地

09-04 898

正态或高斯分布（Normal 或 Gaussian）分布

DNN-贝叶斯算法代码

05-28

DNN-贝叶斯算法是一种基于神经网络和贝叶斯思想的分类算法，通过将神经网络中的权重和偏置看做是随机变量，并利用贝叶斯公式计算后验概率来进行分类。其代码实现主要分为两部分：网络结构搭建和后验概率计算。网络结构搭建：在网络结构搭建方面，可以使用Keras、PyTorch等深度学习框架来实现，这里以Keras为例介绍。首先需要定义一个包含输入层、隐藏层和输出层的神经网络模型，代码如下： ```python from keras.models import Sequential from keras.layers import Dense # 定义神经网络模型 model = Sequential() model.add(Dense(units=64, activation='relu', input_dim=input_dim)) model.add(Dense(units=num_classes, activation='softmax')) ``` 其中，input_dim表示输入数据的维度，num_classes表示类别数。这里定义了一个包含一个隐藏层的全连接神经网络模型，隐藏层包含64个神经元，激活函数为ReLU，输出层包含num_classes个神经元，激活函数为Softmax。后验概率计算：在后验概率计算方面，需要对权重和偏置进行先验分布的设定，并使用贝叶斯公式计算后验概率。这里以PyMC3库为例介绍如何实现。首先需要定义先验分布，代码如下： ```python import pymc3 as pm with pm.Model() as model: # 定义权重和偏置的先验分布 weights = [pm.Normal('w'+str(i), mu=0, sd=1, shape=(input_dim, 64)) for i in range(2)] biases = [pm.Normal('b'+str(i), mu=0, sd=1, shape=(64,)) for i in range(2)] ``` 其中，weights和biases分别表示权重和偏置的先验分布，使用Normal函数定义正态分布。mu表示均值，sd表示标准差，shape表示分布形状。然后，需要定义Likelihood函数，并使用贝叶斯公式计算后验概率，代码如下： ```python with model: # 定义Likelihood函数 nn_output = pm.Deterministic('nn_output', pm.math.softmax(pm.math.dot(X, weights) + biases)) y_obs = pm.Categorical('y_obs', p=nn_output, observed=y) # 使用NUTS采样器进行后验概率计算 trace = pm.sample(1000, tune=1000, chains=1) ``` 其中，nn_output表示神经网络的输出结果，使用Deterministic函数定义；y_obs表示观测值，使用Categorical函数定义；p表示类别的概率分布。最后使用NUTS采样器进行后验概率计算，并得到trace结果。