机器学习——数据预处理

最新推荐文章于 2024-07-17 01:42:37 发布

qq_34598178

最新推荐文章于 2024-07-17 01:42:37 发布

阅读量352

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/qq_34598178/article/details/106675486

版权

本文介绍了机器学习中数据预处理的重要性，特别是归一化过程，以避免数值问题影响分类器效果。归一化是将数据缩放至特定范围，保持数据间相对关系，便于后续处理和加速收敛。文章还详细讲解了OpenCV中的`normalize`函数，包括其参数和归一化类型，并提到了标题数据标准化的更多方法。

摘要由CSDN通过智能技术生成

机器学习——数据预处理

normalize函数介绍

在机器学习使用SVM,KNN等分类算法时避免特征数据中某些过大数值或过小值区间的属性值过分支配了整体特征属性，影响分类器的参数取值以及训练效果。例如，线性核和多项式核力，属性的大数值可能会导致数值问题。

1. 归一化

归一化就是要把需要处理的数据经过处理后（通过某种算法）限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便，其次是保证程序运行时收敛加快。归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布，归一化在某个区间上是统计的坐标分布。归一化有同一、统一和合一的意思。
归一化的目的简而言之，是使得没有可比性的数据变得具有可比性，同时又保持相比较的两个数据之间的相对关系，如大小关系；或是为了作图，原来很难在一张图上作出来，归一化后就可以很方便的给出图上的相对位置等。

当然，我们必须使用同样的方法缩放训练数据和测试数据。例如，假设我们把训练数据的第一个属性从[-10,+10]缩放到[-1, +1]，那么如果测试数据的第一个属性属于区间[-11, +8]，我们必须将测试数据转变成[-1.1, +0.8]。

2. normalize 函数介绍

函数原型：

void normalize(InputArray src,OutputArray dst, double alpha=1, doublebeta=0, int norm_type=NORM_L2, int dtype=-1, InputArray mask=noArray() )

最低0.47元/天解锁文章

qq_34598178

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习——数据预处理

机器学习——数据预处理normalize函数介绍在机器学习使用SVM,KNN等分类算法时避免特征数据中某些过大数值或过小值区间的属性值过分支配了整体特征属性，影响分类器的参数取值以及训练效果。例如，线性核和多项式核力，属性的大数值可能会导致数值问题。1. 归一化归一化就是要把需要处理的数据经过处理后（通过某种算法）限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便，其次是保证程序运行时收敛加快。归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布，归一化在某个区间
复制链接

扫一扫