《Machine Learning for OpenCV》学习笔记：数据预处理

最新推荐文章于 2021-12-28 14:32:40 发布

此生小会

最新推荐文章于 2021-12-28 14:32:40 发布

阅读量233

点赞数

分类专栏： AI 文章标签： scikitlearn preprocessing

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cckavin/article/details/88675774

版权

本文是《Machine Learning for OpenCV》的学习笔记，主要介绍了特征标准化、特征归一化和特征缩放到特定范围的方法。通过scikit-learn的preprocessing模块，使用scale()函数进行特征标准化，normalize()函数实现特征归一化，并利用MinMaxScaler类将特征缩放到0到1之间。验证方法包括检查标准化和归一化后的数据特性。

摘要由CSDN通过智能技术生成

一.特征标准化

1.1特征标准化：

标准化是指把数据缩放到拥有零均值(均值为0)和单位方差(方差为1)的过程。可以手动标准化我们的数据：每个数据点减去所有数据的平均值 (μ) ，然后除以数据的方差(σ) 。即对于每个特征值，计算(x - μ) / σ 。

1.2scikit-learn代码实现

使用preprocessing模块的scale()函数实现。

1.3验证

一个实现了标准化后的特征矩阵应该每行的均值等于(或接近于)，每一行的方差都为1。可以查看矩阵的mean属性和std属性进行验证。

# -*- coding:utf-8 -*-
from sklearn import preprocessing
import numpy as np

X = np.array(
	[[1., -2., 2.], [3., 0., 0.], [0., 1., -1]]
)   # 创建一个三行三列的二维数组
x_scaled = preprocessing.scale(X)
print(x_scaled)
"""
输出结果：
[[-0.26726124 -1.33630621  1.33630621]
 [ 1.33630621  0.26726124 -0.26726124]
 [-1.06904497  1.06904497 -1.06904497]]
"""
# 方差验证
print(x_scaled.mean(axis=0))  # [7.40148683e-17 0.00000000e+00 0.00000000e+00]
print(x_scaled.std())   # 1.0

二.特征归一化

归一化是缩放单个样本以使它们拥有单位范数的过程。在scikit-learn中，数据可以使用norma

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

此生小会 CSDN认证博客专家 CSDN认证企业博客

码龄10年

143: 原创

3万+: 周排名

149万+: 总排名

77万+: 访问

: 等级

5375: 积分

90: 粉丝

299: 获赞

117: 评论

829: 收藏

私信

关注

热门文章

分类专栏

leetcode
Python 57篇
MongoDB 5篇
Redis 2篇
Django 7篇
Flask 19篇
Data Structure And Algorithm 1篇
DataBase 4篇
爬虫 3篇
Tool 7篇
Linux 9篇
Git 6篇
Docker 11篇
Nginx 3篇
Frontend 1篇
Tornado 1篇
AI 11篇

最新评论

webdriver.Chrome()报错：selenium.common.exceptions.WebDriverException: Message: 'chromedriver' ...
Hdr2394: 大家能给我看一下我这个是什么原因呀，我已经整了好久了
webdriver.Chrome()报错：selenium.common.exceptions.WebDriverException: Message: 'chromedriver' ...
Hdr2394: Traceback (most recent call last): File "D:/py/python study/spider_study/spider_尚硅谷/078_selenium_study.py", line 5, in <module> browser=webdriver.Chrome(path) File "D:\py\python study\spider_study\venv\lib\site-packages\selenium\webdriver\chrome\webdriver.py", line 76, in __init__ RemoteWebDriver.__init__( File "D:\py\python study\spider_study\venv\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 157, in __init__ self.start_session(capabilities, browser_profile) File "D:\py\python study\spider_study\venv\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 252, in start_session response = self.execute(Command.NEW_SESSION, parameters) File "D:\py\python study\spider_study\venv\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 319, in execute response = self.command_executor.execute(driver_command, params) File "D:\py\python study\spider_study\venv\lib\site-packages\selenium\webdriver\remote\remote_connection.py", li
Node--Ubuntu下源码编译安装Node.js（时间比较长）
水煮花生-: 我从上班开始make，然后下班正好make完，这下合理摸鱼了
Python--遍历列表时删除元素的正确做法
qq_41745159: 思路一下清晰了，感谢
django.db.utils.OperationalError: (1366, "Incorrect string value: '\\xF0\\x9F\\x90\\x8D \\xC2...' )
不会打代码的计算机学习人: 没有配置文件可以怎没更改

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。