什么是:智能监测网络。。。
答:这个中心是融合互联网云计算大数据分析,结合光谱检测,实现对食品安全,环保监测,精细农业等重点领域的智能检测。
什么是机器学习?
答:基于数理统计算法,对目标特征及属性建立学习模型,从而达到预测新属性的目的。因此这里将血红蛋白的光谱特征及其含量属性,通过建模学习,从而达到快速预测新目标的血红蛋白含量的目的。
什么是BP-神经网络。
神经网络构造多层神经元,并利用数据的高维特征及属性对层与层之间神经元的连接权重进行不断地训练,最终得到一组属性,使得数据特征和属性达到最佳的映射效果。
什么叫最佳映射效果?
将尽可能都的样本原始属性与模型预测的预测属性保持一致,这里的数学模型指的是数据特征与属性的映射关系。
什么是SVM?
本项目中主要涉及的是 支持向量机的二分类线性问题,模型越简单预测能力越强。
数学原理:最大化训练数据间隔。样本空间中找到一条分类线或者超平面对目标进行线性分割。
什么是随机森林?
是由多个决策树组成,输出的类别是取决于决策树中预测属性最多的类别。
项目中采用500个树,每个树100个。
什么是决策树?
将样本的所有属性依次作为判断条件,实现分类。
属性选择的顺序是根据信息增益方法,信息增益大的属性作为根节点,在每一个子节点中重新计算其他属性的信息增益作为该节点的属性。
决策树的剪枝方案:(目的:防止过拟合)
预剪枝(缺点:可能会导致欠拟合)
后剪枝(缺点:计算量过大)
决策树ID3:根据信息增益判断属性顺序。
决策树C4.5:根据信息增益比(信息增益与特征熵的比值)判断属性顺序。
PLS
将X和Y进行PCA降维,降维后的特征数据同构最小二乘拟合法,拟合最终的线性回归系数。
SG-PLS
SG是根据实际光谱特征性质,对数据谱线进行降噪处理,更好的提取数据信息。
LR分类器
逻辑回归是基于sigmoid函数的有监督分类器。利用对数似然估计构造优化函数结合梯度下降方法,沿着负梯度方向修正模型参数到达最佳的分类效果。
随机梯度下降和小批量梯度下降
梯度下降方法用来取得目标函数的极值。定义域内随机选取模型参数的值,以一定的的步长,沿着负梯度的方向进行迭代,最终使目标函数得到最优解(最小值)。
随机梯度下降定义:
取样本总体中一个样本的误差平方和作为目标函数,按照梯度下降方式得到最优参数。
小批量梯度下降:
取样本总体中部分样本的误差平方和作为目标函数,按照梯度下降方式得到最优参数。