数学建模散

Curry30Messi

于 2023-08-30 19:11:26 发布

阅读量111

点赞数

文章标签：数学建模

本文链接：https://blog.csdn.net/weixin_73479446/article/details/132554066

版权

除了t检验之外，统计学中还有其他常用的假设检验方法，下面列举几种常见的方法：

方差分析（ANOVA）：用于比较三个或更多组之间均值是否存在显著差异。它可以扩展到单因素（单个因素的多个水平）、双因素（两个因素的多个水平）以及多因素（多个因素的多个水平）方差分析。

卡方检验（Chi-squared Test）：用于比较观察频数与期望频数之间的差异，从而判断两个变量之间是否存在关联性。常用于分析分类变量之间的关系。

相关分析：用于评估两个连续变量之间的相关性。常用的方法包括皮尔逊相关系数和斯皮尔曼等级相关系数。

独立性检验：用于检验两个分类变量之间的独立性。常用的方法包括卡方检验和Fisher精确检验。

非参数检验：与参数检验相对，非参数检验不要求数据满足特定的分布假设。常用的非参数检验方法有Wilcoxon符号秩检验、Mann-Whitney U检验和Kruskal-Wallis检验等。

McNemar检验：用于比较两个相关样本的分类变量之间的差异，适用于配对样本的二项分布数据。

以上仅是统计学中一些常见的假设检验方法，具体选择哪种方法取决于你的研究问题、数据类型以及前提条件的满足程度。在使用任何假设检验方法时，都需要仔细考虑前提条件、选择适当的方法并正确解读结果。

非参数检验是一种统计学方法，用于对数据进行假设检验，特别是当数据不符合正态分布或者样本量较小时。相比于参数检验，非参数检验不依赖于数据的具体分布情况，而是利用样本数据的秩次信息进行推断。

在非参数检验中，常用的方法包括：

Wilcoxon符号秩检验：用于比较两个相关样本或配对样本数据之间的差异。
Mann-Whitney U检验：用于比较两个独立样本数据集的差异。
Kruskal-Wallis单因素方差分析：用于比较多个独立样本数据集的差异。
Friedmantest：用于比较多个相关样本数据集的差异。
符号检验：用于比较两个配对样本数据集的差异。

非参数检验通常适用于以下情况：

数据不满足正态分布或对分布做不了明确的假设；
样本量较小；
数据存在极端值或离群点等影响。

非参数检验的优势在于它更加灵活，可以适用于各种数据类型和分布情况，而不需要过多的假设。然而，非参数检验对于某些问题可能缺乏统计效力，需要根据具体情况选择适当的检验方法。在进行统计推断时，应该综合考虑样本量、数据类型以及研究设计等因素，选择合适的参数或非参数检验方法进行分析。

McNemar检验是一种用于比较配对二分类数据的非参数统计方法。它用于检验两个相关样本之间，分类结果的差异是否显著。

McNemar检验通常应用于以下情况：

数据为二分类数据；
样本来自于配对设计，即同一个个体在不同条件或时间点下进行观察或处理。

McNemar检验的原假设是两个相关样本中，分类结果没有显著差异。对立假设则是两个相关样本中，分类结果存在显著差异。

具体实施McNemar检验的步骤如下：

构建一个2x2的列联表，记录两个相关样本在分类结果上的差异。
计算出现一致结果和不一致结果的频数。
利用 McNemar 检验的统计量进行假设检验，该统计量计算公式为：𝜒² = ((|b - c| - 1)²) / (b + c)，其中 b 和 c 分别表示两个相关样本中的错误分类次数。
根据所得的统计量，查找对应的临界值或计算 p 值，以评估差异的显著性。

如果 McNemar 检验的 p 值小于预先设定的显著性水平（通常为 0.05），则可以拒绝原假设，即认为两个相关样本在分类结果上存在显著差异。

需要注意的是，McNemar检验对于配对样本且分类结果为二分类的数据比较适用。如果数据不满足这些条件，可能需要考虑其他的非参数或参数检验方法。

t检验（Student's t-test）是一种统计假设检验方法，用于比较两个样本均值是否存在显著差异。它最常用于以下两种情况：

独立样本t检验：用于比较两个独立样本的均值是否显著不同。例如，你想知道男性和女性在身高上是否存在显著差异，那么可以使用独立样本t检验。

配对样本t检验：用于比较同一组样本在不同条件下的均值是否显著不同。例如，你想知道某种药物治疗前后患者的血压是否存在显著变化，那么可以使用配对样本t检验。

在进行t检验时，我们关注的主要指标是t统计量和p值：

t统计量：用于度量样本均值之间的差异相对于其标准误差的大小。较大的t值表示差异更显著。
p值：表示在原假设下观察到当前差异或更极端差异的概率。如果p值小于预先设定的显著性水平（通常是0.05），则可以拒绝原假设，认为样本均值存在显著差异。

在Python中，你可以使用不同的库或函数进行t检验，如scipy.stats中的ttest_ind()、ttest_rel()等，或者statsmodels.stats.weightstats中的ttest_ind()。根据你的需求和数据类型选择适当的函数进行计算。

需要注意的是，在进行t检验之前，还需要满足一些假设前提，如样本应该近似服从正态分布、方差齐性等。在应用t检验时，最好仔细考虑这些前提条件，并选择适合的假设检验方法。

皮尔逊相关系数和斯皮尔曼等级是两种常用的统计量，用于衡量两个变量之间的相关程度。

皮尔逊相关系数（Pearson correlation coefficient）是一种线性相关系数，用于度量两个连续变量之间线性关系的强度和方向。它的取值范围在-1到1之间，其中-1表示完全负相关，0表示无相关，1表示完全正相关。皮尔逊相关系数假设变量之间存在线性关系，并且要求变量满足正态分布和线性独立性的假设。

斯皮尔曼等级相关系数（Spearman rank correlation coefficient）是一种非参数统计量，用于度量两个变量之间的单调关系的强度和方向。与皮尔逊相关系数不同的是，斯皮尔曼等级相关系数不对变量的分布做出任何假设，因此适用于任何类型的变量，包括名义变量和有序变量。它的取值范围也在-1到1之间，具有与皮尔逊相关系数相似的解释。

需要注意的是，皮尔逊相关系数适用于连续变量之间的线性关系，而斯皮尔曼等级相关系数则更适用于有序变量或非线性关系。在实际应用中，根据变量的特点和研究问题的需求选择合适的相关系数进行分析。

在许多编程语言和库中，axis=0是用于指定对数组或矩阵进行操作的维度参数。

具体含义会根据上下文而有所不同，以下是两种常见情况：

在NumPy或类似的科学计算库中，当使用axis=0时，表示沿着数组的第一个维度进行操作。例如，在一个二维数组中，沿着axis=0对应的维度进行操作将会沿着行的方向进行操作。这可以用于计算各列的统计量、对各行进行归一化等。

在某些机器学习库（如TensorFlow、PyTorch）中，axis=0通常表示沿着批处理维度进行操作。这是因为在训练神经网络时，通常会使用一个批次(batch)的数据一起进行前向传播或反向传播。在这种情况下，axis=0表示对批次的维度进行操作，例如对整个批次进行平均或求和。

需要注意的是，不同的库或函数可能对axis参数的使用方式存在差异，具体取决于该函数的定义和设计。因此，在实际使用时，应该参考相关文档或函数说明以了解axis参数的具体含义。

vstack：vstack用于垂直（按行）堆叠两个或多个数组。它将数组沿着垂直方向堆叠，即行数增加，列数不变。要使用vstack函数，被堆叠的数组在水平方向上必须具有相同的列数。
hstack：hstack用于水平（按列）堆叠两个或多个数组。它将数组沿着水平方向堆叠，即列数增加，行数不变。要使用hstack函数，被堆叠的数组在垂直方向上必须具有相同的行数。
import numpy as np

# 创建示例数组
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
c = np.array([7, 8, 9])

# 使用vstack进行垂直堆叠
vstack_result = np.vstack((a, b, c))
print("vstack结果：")
print(vstack_result)
# 输出：
# [[1 2 3]
#  [4 5 6]
#  [7 8 9]]

# 使用hstack进行水平堆叠
hstack_result = np.hstack((a.reshape(-1, 1), b.reshape(-1, 1), c.reshape(-1, 1)))
print("hstack结果：")
print(hstack_result)
# 输出：
# [[1 4 7]
#  [2 5 8]
#  [3 6 9]]

在数学建模中，常用的算法可以用于优化问题、评价问题和预测问题的解决包括以下几种：

优化问题常用算法：

线性规划（Linear Programming）：用于解决线性约束下的最优化问题。
整数规划（Integer Programming）：用于解决决策变量为整数的最优化问题。
非线性规划（Nonlinear Programming）：用于解决非线性约束下的最优化问题。
遗传算法（Genetic Algorithms）：通过模拟自然界的进化过程，通过遗传操作寻找全局最优解。
蚁群算法（Ant Colony Optimization）：模拟蚂蚁寻找食物的行为，通过信息素机制搜索最优解。
粒子群优化算法（Particle Swarm Optimization）：模拟鸟群觅食行为，通过粒子与全局信息的交互来搜索最优解。

评价问题常用算法：

主成分分析（Principal Component Analysis，PCA）：用于降维和特征提取，可将高维数据映射到低维空间。
因子分析（Factor Analysis）：用于确定多个变量之间的潜在因子结构，并减少变量维度。
层次分析法（Analytic Hierarchy Process，AHP）：基于对比判断矩阵，用于多个指标的综合评价。
支持向量机（Support Vector Machine，SVM）：用于分类和回归问题，通过在特征空间中找到最优超平面。

预测问题常用算法：

线性回归（Linear Regression）：用于建立变量之间的线性关系，进行回归预测。
逻辑回归（Logistic Regression）：用于分类问题，将线性回归模型映射到概率空间中。
决策树（Decision Tree）：通过树形结构进行分类和回归，具有可解释性。
随机森林（Random Forest）：基于多个决策树的集成学习方法，用于分类和回归问题。
支持向量机（Support Vector Machine，SVM）：也可用于预测问题，通过分类或回归找到最优超平面。

这些算法在数学建模中被广泛应用，但选择合适的算法取决于具体问题的特征、数据类型以及建模目标。

2023/8/29 11:19:36

不要包含机器学习里面的算法，多一些小白可以用的，重新回答

2023/8/29 11:19:58

当涉及到数学建模中的优化问题、评价问题和预测问题时，以下是一些小白友好的常用算法：

优化问题常用算法：

穷举搜索（Exhaustive Search）：遍历所有可能的解空间来找到最优解。
贪婪算法（Greedy Algorithm）：每步选择当前最优解，期望通过局部最优来达到全局最优。
动态规划（Dynamic Programming）：将问题划分为相互重叠的子问题，并利用子问题的解来构建最优解。
单纯形法（Simplex Method）：用于线性规划问题，通过迭代优化目标函数的值来找到最优解。

评价问题常用算法：

加权平均法（Weighted Average Method）：对多个指标进行加权求和，得到综合评价结果。
熵权法（Entropy Weight Method）：基于信息熵的概念，计算指标的权重，用于综合评价。
专家打分法（Expert Scoring Method）：根据专家的主观打分，进行指标的加权求和。
层次分析法（Analytic Hierarchy Process，AHP）：通过对比判断矩阵，进行层次结构的定量分析和综合评价。

预测问题常用算法：

线性回归（Linear Regression）：通过拟合线性模型，进行对未知数据的预测。
移动平均法（Moving Average Method）：基于历史数据的平均值，进行未来数值的简单预测。
指数平滑法（Exponential Smoothing Method）：根据历史数据的权重分配，进行未来数值的预测。
时间序列方法（Time Series Methods）：分析和预测时间序列数据的趋势、周期性和季节性。

这些算法相对简单易懂，不需要深入了解复杂的数学理论和机器学习算法。它们适用于初学者或非专业人士，但在实际应用中可以提供有效的结果。

数学建模国赛的问题类型可以分为以下几大类：

优化问题：这类问题要求在给定约束条件下，找到某个目标函数的最优解。常见的优化问题包括线性规划、整数规划、非线性规划等。

动力系统建模：这类问题涉及到描述随时间变化的系统，包括微分方程和差分方程的建模与求解。常见的动力系统建模问题包括人口增长模型、物理系统的运动模型等。

统计建模与数据分析：这类问题需要通过收集和分析数据来提取有用的信息和规律。常见的统计建模问题包括回归分析、时间序列分析、因子分析等。

离散事件建模：这类问题涉及到描述在离散时间点上发生的事件或决策。常见的离散事件建模问题包括排队论、网络流问题、图论等。

图像处理与模式识别：这类问题涉及到处理和分析图像数据，进行特征提取和模式识别。常见的图像处理与模式识别问题包括图像分割、目标检测、人脸识别等。

建筑、交通与城市规划：这类问题涉及到对建筑、交通和城市规划等领域的问题进行建模与分析。常见的问题包括城市交通流量优化、建筑能源消耗分析等。

组合优化与排程问题：这类问题涉及到在有限资源约束下的组合和排程问题。常见的组合优化与排程问题包括旅行商问题、作业车间调度问题等。

以上是一些常见的数学建模国赛问题类型，但实际上数学建模的应用领域非常广泛，可能涉及到其他领域和问题类型。在比赛中，通常会给出具体背景和条件，要求参赛者对问题进行适当的数学建模并给出解决方案。