在该系统的算法与设计以及优化部分,通过适当数据清洗,数据降噪,完成对数据的预处理,将数据映射到合适的低维空间,挖掘数据分布的模式,检验稀疏模式与负相关模式是否存在,最后使用经过优化处理的神经网络机器学习模型求得数据在假设空间上的拟合函数,完成最终的分类任务。
4.1 数据清洗
数据清洗对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。
在进行常规的检验数据的时候,根据基本原则,去掉重复数据与冲突数据。将采集到的数据视为均匀分布在设定的特征值数量的情况下,根据得到的数据分布选择适当的插值来补充缺失的特征。对于这样经过快速傅立叶变换后的数据,经过多次实验,最终选择牛段插值法。
4.2 数据降噪
信息中的噪声数据的变化波动幅度相对于整体数据而言是较小的。并且观察数据分布,经过清洗后的数据经过高斯分布检验呈现出正态分布的趋势,那么在进行降维降噪处理时就可以使用KPCA(kernel principal component analysis)进行处理分析。
在这个过程中主要进行的操作有:
计算核矩阵
中心化核矩阵
求中心化核矩阵的特征值和特征向量
按照从从大到小排序选取前n个特征值的特征向量
将高维数据与核矩阵以及选择出的特征值运算映射到低维空间求得数据的主成分完成降噪降维处理
SonicOperator之算法优化
最新推荐文章于 2022-05-16 23:14:30 发布