拉丁超立方采样（Latin Hypercube Sampling）技术详解及实现

府学路18号车神

已于 2025-02-28 16:46:11 修改

阅读量3.9k

点赞数 20

分类专栏： Pig Has Dream 文章标签： python 机器学习数据分析拉丁超立方采样

于 2025-02-27 15:41:14 首次发布

本文链接：https://blog.csdn.net/weixin_44333889/article/details/145905574

版权

Pig Has Dream 专栏收录该内容

1 篇文章

订阅专栏

拉丁超立方采样（Latin Hypercube Sampling）技术详解

拉丁超立方采样（Latin Hypercube Sampling）技术详解
代码解析
5. 应用场景与优势
6. 在化工中的应用
待续

拉丁超立方采样（Latin Hypercube Sampling）技术详解

拉丁超立方采样是一种用于多维参数空间采样的统计方法，广泛应用于不确定性量化、敏感性分析以及工程仿真等领域。本文将深入浅出地介绍其原理、数学公式，并结合 Python 代码实现演示如何高效生成满足均匀性要求的采样点。

1. 引言

在很多实际问题中，参数的不确定性可能导致模型结果的显著变化。传统的蒙特卡洛采样虽然简单，但在高维情况下需要大量样本才能覆盖参数空间。拉丁超立方采样作为一种改进方案，通过保证各维度均匀分布，能在较少样本下实现较好的覆盖效果，从而提高仿真效率。

2. 拉丁超立方采样原理

拉丁超立方采样的基本思想可以概括为：

分割区间：对于每个维度，将变量所在区间均匀划分为 (N) 个互不重叠的子区间（通常 (N) 为样本数）。
在子区间内随机采样：在每个子区间内随机抽取一个点，保证每个区间仅使用一次。
随机排列组合：对每个维度均进行上述采样，再通过随机排列组合不同维度的采样点，形成多维采样点矩阵。

这种方法确保了在任一维度上，采样点都均匀分布在整个区间内，从而避免了传统随机采样中可能出现的“空洞”。

3. 数学公式描述

设有 $d$ 个维度，每个维度的区间被划分为 $N$ 个等概率子区间，令 $i=1,2,\dots,N$ 表示样本编号， $j=1,2,\dots,d$ 表示维度。对于每个维度 $j$ ：

先随机生成一个排列 $\pi_j$ ，使得 $\pi_j(i)$ 表示第 $i$ 个样本在第 $j$ 维的区间编号。
对于每个样本，在第 $j$ 维的采样点可以由下面的公式计算：

$x_{ij} = \frac{\pi_j(i) - u_{ij}}{N}$

其中 $u_{ij}$ 是从均匀分布 $U (0, 1)$ 中采样得到的随机数。

该公式的含义是：先确定样本所在的区间，再在该区间内随机抽取一个具体位置。这样既保证了每个区间必有一个样本，又能在每个子区间内实现随机性。

4. Python代码实现

下面给出一个基于 NumPy 的 Python 实现示例，用于生成拉丁超立方采样点。

import numpy as np
import matplotlib.pyplot as plt

def lhs_sampling(n_samples, n_dimensions):
    """
    使用拉丁超立方采样生成样本点

    参数：
        n_samples (int): 样本总数
        n_dimensions (int): 参数空间的维度

    返回：
        np.ndarray: 形状为 (n_samples, n_dimensions) 的采样点数组，每个元素均在 [0,1) 内
    """
    # 初始化采样矩阵
    result = np.empty((n_samples, n_dimensions))
    
    # 对每个维度进行独立采样
    for j in range(n_dimensions):
        # 生成 1 到 n_samples 的随机排列，表示每个样本所在的子区间编号
        perm = np.random.permutation(n_samples) + 1
        # 在每个子区间内采样一个随机点，注意这里 rand(n_samples) 返回 [0,1) 内的随机数
        result[:, j] = (perm - np.random.rand(n_samples)) / n_samples
        
    return result

# 示例：生成 100 个样本点，每个样本为 2 维
if __name__ == '__main__':
    samples = lhs_sampling(100, 2)
    
    # 可视化结果，帮助理解采样分布
    plt.figure(figsize=(6, 6))
    plt.scatter(samples[:, 0], samples[:, 1], c='b', marker='o', edgecolors='k', alpha=0.7)
    plt.title('Latin Hypercube Sampling (2D)')
    plt.xlabel('Dimension 1')
    plt.ylabel('Dimension 2')
    plt.grid(True)
    plt.show()