2.3 数据变换【李沐-斯坦福21秋季:实用机器学习中文版】

2.3 数据变换

1.数据流程:原始数据–标注及清理–数据变形–特征工程–模型训练

在这里插入图片描述

2. 数据归一化

1. Max-Min Normalization算法:

  把一个列里面的数值的最小值与最大值都限定到一个固定区间内,然后把所有的元素只通过线性变化出来【将数据的单位放到合理的区间】;

2. Z-Score 算法:

  通过算法使得均值变为0,方差变为1 。把一列的数据换成是-1到1之间的数据。

3. Decimal-Scaling 算法:

  使Xi➗10的阶乘,使Xi的绝对值处于-1与1之间。

4. Log-Scaling 算法:

  对数值都是大于0,且数值变换比较大可以试一下log一下【log上面的加减等于原始数据的乘除,可以将计算基于百分比的】。
在这里插入图片描述

3. 图象变换

  将图片的尺寸变小,机器学习对低分辨率的图片不在意,图片采样的比较小,且jpeg选用中等质量压缩,可能会导致精度有1%的下降(ImageNet),凡是数据的大小与质量要做权衡,要么不要下采样,要么下采样的时候数据的质量(分辨率)就要高一点。通常数据质量更加的重要。

在这里插入图片描述

4. 视频变换

  1. 当你拿到VIDEO的时候,你需要将他缩减成对你最有用的片段,因为机器学习看不了那么长的视频

  2. 把视频压缩,但是读取比较困难

  3. 处理视频的时候,我们可以提取关键帧,而并不是输入整个视频

在这里插入图片描述

5. 文本变换

  1. 词根化(语法化):把一个词变成常见的形式
  2. 词元化(机器学习算法中最小的单元也就是token)

在这里插入图片描述

总结:

在这里插入图片描述

  • 13
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AiCharm

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值