2.5.1 核密度估计(PRML读书笔记)

本章小结

  让我们假设观测服从 D D D维空间的某个未知的概率密度分布 p ( x ) p(x) p(x)。把这个 D D D维空间选择成欧⼏⾥得空间,考虑包含 x x x的某个⼩区域 R R R,则这个区域的概率质量为
在这里插入图片描述
假设收集了服从 p ( x ) p(x) p(x)分布的 N N N次观测,很容易得出位于区域 R R R内部的数据点总数 K K K满足
在这里插入图片描述
如果假定区域 R R R⾜够⼩,使得在这个区域内的概率密度 p ( x ) p(x) p(x)⼤致为常数,那么有

其中 V V V是区域 R R R的体积。把公式(2.244)和公式(2.245)结合,得到概率密度的估计为
在这里插入图片描述
  有两种⽅式利⽤(2.246)的结果。可以固定 K K K然后从数据中确定 V V V 的值,这就是 K K K近邻⽅法。还可以固定 V V V然后从数据中确定 K K K,这就是核⽅法。在极限 N → ∞ N\rightarrow\infty N的情况下,如果 V V V随着 N N N⽽合适地收缩,那么可以证明 K K K近邻概率密度估计会收敛到真实的概率密度。同样的,在极限 N → ∞ N\rightarrow\infty N的情况下,如果 K K K随着 N N N增⼤,那么可以证明核⽅法概率密度估计也会收敛到真实的概率密度。

  先详细讨论核⽅法。把区域 R R R取成以 x \textbf{x} x为中⼼的⼩超⽴⽅体,定义下⾯的函数
在这里插入图片描述
这表⽰⼀个以原点为中⼼的单位⽴⽅体。函数 k ( u ) k(u) k(u)是核函数的⼀个例⼦,在这个问题中也被称为Parzen窗。如果数据点 x n x_n xn位于以 x x x为中⼼的边长为 h h h的⽴⽅体中,那么量 k ( x − x n h ) k(\frac{x-x_n}{h}) k(hxxn)的值等于1,否则它的值为0。于是,位于这个⽴⽅体内的数据点的总数为
在这里插入图片描述
把这个表达式代⼊公式(2.246),得
在这里插入图片描述
  核密度估计(2.249)有⼀个问题,就是⼈为带来的⾮连续性,是由⽴⽅体的边界引起得。如果我们选择⼀个平滑的核函数,就可以得到⼀个更加光滑的模型,⼀个常见的选择是⾼斯核函数,于是可得
在这里插入图片描述
公式2.250中的概率密度模型可以通过这种⽅式获得:令每个数据点 x \textbf{x} x都服从⾼斯分布,然后把数据集⾥的每个数据点的贡献相加,之后除以 N N N,使得概率密度正确地被归⼀化。在图2.25中,我们把模型(公式2.250)应⽤于之前⽤来说明直⽅图⽅法的数据集上。我们看到,参数 h h h对平滑参数起着重要的作⽤。⼩的 h h h会造成模型对噪声过于敏感,⽽⼤的 h h h会造成过度平滑,因此要进⾏⼀个折中。与之前⼀样,对 h h h的优化是⼀个模型复杂度的问题,类似于直⽅图概率密度估计中对于箱⼦宽度的选择,也类似于曲线拟合问题中的多项式阶数。
在这里插入图片描述
我们可以任意选择公式(2.249)中的核函数,只要满⾜下⾯的条件
在这里插入图片描述
  这确保了最终求得的概率分布在处处都是⾮负的,并且积分等于1。公式(2.249)给出的概率密度模型被称为核密度估计,或者Parzen估计。它有⼀个很⼤的优点,即不需要进⾏“训练”阶段的计算,因为“训练”阶段只需要存储训练集即可。然⽽,这也是⼀个巨⼤的缺点,因为估计概率密度的计算代价随着数据集的规模线性增长。

互动话题

  • 2.5节曾经提到,与简单的直⽅图⽅法相⽐,核密度方法对于维度的放⼤有着更好的适应性。如何理解?
    如果核函数选的是公式2.247,依然没有彻底解决维度灾难,公式2.250的高斯平滑核函数倒是更多的缓解了维度灾难。
  • 6
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: libseccomp 2.5.1是一个开源的软件包,用于在Linux操作系统上实现系统调用过滤。它的目的是提供一种安全机制,限制应用程序对系统调用的访问,以减少可能的安全漏洞和攻击表面。 libseccomp 2.5.1使用了一种叫做“seccomp”的内核特性,该特性可以通过过滤系统调用来限制应用程序的权限。通过使用libseccomp 2.5.1,开发者可以定义一个安全策略,仅允许应用程序访问特定的系统调用,从而避免不必要或潜在危险的操作。 与其他类似的工具相比,libseccomp 2.5.1具有较为简洁和高效的设计。它提供了易于使用的API,方便开发者定义和管理系统调用策略。通过配置一组规则,开发者可以指定允许的系统调用和参数,并为其设置允许或拒绝的动作。 使用libseccomp 2.5.1可以提供一定程度的安全性,特别是在运行不受信任的应用程序时。通过限制应用程序的系统调用能力,可以减少潜在的攻击面,并提高系统的整体安全性。 总之,libseccomp 2.5.1是一个功能强大的开源软件包,它提供了一种有效的机制来限制应用程序对系统调用的访问。通过使用libseccomp 2.5.1,开发者可以增加应用程序的安全性,并减少潜在的攻击风险。 ### 回答2: libseccomp是一个开源的软件项目,旨在为Linux系统提供安全和隔离机制。libseccomp 2.5.1是libseccomp项目的一个特定版本。 libseccomp 2.5.1主要提供了一个用于开发者的用户空间库,用于与Linux内核的seccomp过滤器系统进行交互。seccomp是Linux内核中的一个子系统,用于限制进程的系统调用访问。通过seccomp,开发者可以以一种更细粒度的方式控制进程对系统调用的访问,从而提高应用程序的安全性和可靠性。 libseccomp 2.5.1版本相较于之前的版本有一些改进和升级。它修复了一些已知的问题、缺陷和漏洞,提高了整体的稳定性和安全性。该版本还引入了一些新的功能和API,使开发者可以更灵活地使用seccomp过滤器系统。 使用libseccomp 2.5.1,开发者可以通过编程方式定义和加载seccomp过滤器规则,限制进程对指定系统调用的执行。这在某些情况下很有用,例如,限制进程对敏感系统调用的访问,从而减少潜在的安全风险。libseccomp提供了一套简单直观的API,使开发者能够轻松地实现这些安全策略。 总之,libseccomp 2.5.1是一个开源项目,它提供了一种简单而有力的机制来增加Linux系统的安全性和隔离性。开发者可以使用libseccomp库与Linux内核的seccomp过滤器系统进行交互,以控制进程的系统调用访问,从而提高应用程序的安全性和可靠性。 ### 回答3: libseccomp 2.5.1 是一个开源的 Linux 库,用于实现沙盒安全机制。它通过对进程的系统调用进行过滤和限制,提供了一种保护应用程序免受恶意代码和攻击的方法。 libseccomp 2.5.1 提供了一种可编程的接口,使开发者能够指定要允许或禁止的系统调用。可以通过设置规则来限制应用程序对特定系统调用的访问,从而减少潜在的安全风险。这些规则可以基于进程的 UID、GID、基于网络的规则,或者是自定义的规则。 此外,libseccomp 2.5.1 还提供了一组默认的规则,用于限制一些常用的风险系统调用。该库还支持动态加载和卸载规则,使得管理员可以根据需要对系统调用进行实时调整。 通过使用 libseccomp 2.5.1,可以减少应用程序受到的攻击面,提高安全性。它可以防止应用程序执行危险的系统调用,避免潜在的漏洞被利用。 总之,libseccomp 2.5.1 是一个功能强大的库,为开发者提供了一个可靠的方法来实现沙盒机制,以提高应用程序的安全性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值