![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
一条大咸咸鱼
热爱科研,无法自拔
展开
-
核函数---Mercer条件
对于任意的核函数,它是某个特征空间中的内积运算的充分必要条件是,对于任意的不恒为零的且,有:原创 2022-01-08 11:04:18 · 2779 阅读 · 0 评论 -
博基计划(5)---模型交叉验证方法讨论
对于多变量软测量建模分析,在避免模型过拟合或欠拟合情况下确定最佳模型复杂度或确定关键变量(包括主成分和潜变量)是建立稳定模型的关键,本节主要讨论用于模型子集选择的交叉验证方法。相比于测试集验证,交叉验证只采用校正数据进行模型验证,因此对于检测成本较高的分析过程十分有利,其基本过程三步:(1)划分校正样本子集(训练集、测试集);(注:子集并不一定是当个样本,其样本数大于等于1)(2)基于训练集建立校正模型;(3)校正模型进行预测分析。重复上述步骤,直至所有划分子集验证完成,对不同子集的预测原创 2021-04-24 14:36:21 · 1057 阅读 · 3 评论 -
博基计划(3)---P问题、NP问题、NPC问题、NP-hard问题
在讲P类问题之前先介绍两个个概念:多项式,时间复杂度。(知道这两概念的可以自动跳过这部分)1、多项式:axn-bxn-1+c恩....就是长这个样子的,叫x最高次为n的多项式....咳咳,别嫌我啰嗦。。有些人说不定还真忘了啥是多项式了。。例如第一次看到的鄙人→_→2、时间复杂度我们知道在计算机算法求解问题当中,经常用时间复杂度和空间复杂度来表示一个算法的运行效率。空间复杂度表示一个算法在计算过程当中要占用的内存空间大小,这里暂不讨论。时间复杂度则表示这个算法运行得到想要的解所需的计算工作转载 2020-11-30 10:42:15 · 278 阅读 · 0 评论 -
博基计划(2)---软测量建模
在现代工业控制过程中,提高生产过程控制效益最大化是衡量一个控制系统性能的基本指标。但是由于设备成本和技术等因素限制,很多关键变量(质量参数或质控参数)无法或者难以用传感器进行实时测量。解决该问题的主要途径有:(1)研制新型测量仪表,通过硬件方式进行检测;但是新型仪表研发成本较高,而且对于集成系统而言,新增测量仪表需要生产过程停产改造,这对于大型化工企业而言是无法实现的,最关键的一点是关键变量与容易检测的过程变量一般在不同操作单元,这意味着在线分析仪表分析数据存在分析滞后问题,滞后参数分析影响分析模型准确原创 2020-11-28 10:39:42 · 2188 阅读 · 0 评论 -
博基计划(1)---粒子群算法
在满足特定条件的生产下降低生产成本、保障利益最大化的、是目前生产过程主要解决问题之一。而对于实际分析过程中,求解约束条件下目标函数最优也是优化控制的一个重要部分。目前有多中能够计算智能算法被应用到实际生产过程控制和优化问题求解,例如模糊逻辑、神经网络、遗传算法、模拟退火算法等。基于鸟群模型(Boid模型),Kennedy和Eberhart提出了著名的粒子群优化算法(Particle Swarm Optimization,PSO ),也称微粒子群算法。在PSO模型中,每一个粒子的自身状态由一组位置和速度向原创 2020-11-27 09:59:54 · 1102 阅读 · 0 评论 -
分析数据正态分布检验方法
在对特定分析对象进行建模分析时,一般假设该模型变量服从正态分布,然后采用符合该变量的分析方法建立相关的分析模型。此外,根据熵定理,自然参数一般服从正态分布(高斯分布),因此,在进行建模之前,需要对所分析的数据进行正态分布检验分析,根据数据正态分布特性判断数据采集策略及模型性能优化方法。目前数据正态分布检验方法主要分为3类:1. 图形分析方法(graphical methods)该类方法主要通过对分析数据建立直观图形判断是否服从正态分布,常用的图形分析方法主要有:直方图、Q-Q图及箱形图;2.原创 2020-09-29 21:18:51 · 4896 阅读 · 0 评论 -
机器学习系列5---偏差和方差分解
机器学习的目的就是通过选择合适的算法确定输入和输出变量之间的映射关系,不同学习算法的对比指标一般是对应模型的泛化性能,但是在实际分析过程中模型泛化性能不是单一成分,不同数据集划分或者样本选择均会对泛化性能的不同部分产生影响,一般将学习算法对应模型的泛化误差分为两部分:偏差(预测集)+方差(训练集),具体推导过程如下: 假设对于测试样本,令对应变量标记为,真实输出为;训练集 D 的模型输出为,则对于测试样本,基于训练集模型的期望输出为: ...原创 2020-05-28 16:46:58 · 1672 阅读 · 0 评论 -
机器学习系列1---VC维问题
VC维是机器学习中用于表示机器学习能力的一个重要指标,其大小表示函数集或学习机的复杂性。在介绍一个模型VC维之前需要简要介绍一下数据“Shater(打散)”概念:Lemma 1: 对于一个函数集S,如果存在 h 个样本,能够被S中的函数以所有可能的形式分为两类,则称该函数集能够把 h 个样本打散。Lemma 2: 一个函数集的VC维是指它能够打散的最大样本数 h ,即能够被集...原创 2020-04-27 21:42:24 · 690 阅读 · 0 评论