机器学习 数据预处理之二值化

1、什么是二值化

用0和1来表示样本矩阵中相对于某个给定阈值高于或者低于它的元素

2、作用

作用:一般用在图像处理 (将图像分成黑和白 常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群)

3、示例代码

import  numpy as np
sample = np.array([
    [2, 4, 5, -1],
    [3, 1, 7, -2],
    [6, -3, 2, -1],
], dtype="float")
s = sample.copy()
s[s<=3] = 0     #必须先对小的阈值进行判
s[s>3] = 1
print(s)

4、调用库包代码

import  numpy as np
import  sklearn.preprocessing as sp


sample = np.array([
    [2, 4, 5, -1],
    [3, 1, 7, -2],
    [6, -3, 2, -1],
], dtype="float")
bin = sp.Binarizer(threshold=3)  #生成一个阈值为3的二值化器
new_sample = bin.transform(sample)   #用二值化器对样本进行转换
print(new_sample)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值