2.3 数据变换【李沐-斯坦福21秋季：实用机器学习中文版】

AiCharm

已于 2022-03-15 23:52:40 修改

阅读量2.3k

点赞数 13

文章标签：机器学习人工智能

于 2022-03-12 19:29:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/muye_IT/article/details/123448269

版权

【李沐-斯坦福21秋季：实用机器学习中文版】笔记系列

2.3 数据变换

2.3 数据变换

1.数据流程：原始数据–标注及清理–数据变形–特征工程–模型训练

在这里插入图片描述

2. 数据归一化

1. Max-Min Normalization算法：

把一个列里面的数值的最小值与最大值都限定到一个固定区间内，然后把所有的元素只通过线性变化出来【将数据的单位放到合理的区间】；

2. Z-Score 算法：

通过算法使得均值变为0，方差变为1 。把一列的数据换成是-1到1之间的数据。

3. Decimal-Scaling 算法：

使Xi➗10的阶乘，使Xi的绝对值处于-1与1之间。

4. Log-Scaling 算法:

对数值都是大于0，且数值变换比较大可以试一下log一下【log上面的加减等于原始数据的乘除，可以将计算基于百分比的】。
在这里插入图片描述

3. 图象变换

将图片的尺寸变小，机器学习对低分辨率的图片不在意，图片采样的比较小，且jpeg选用中等质量压缩，可能会导致精度有1%的下降（ImageNet），凡是数据的大小与质量要做权衡，要么不要下采样，要么下采样的时候数据的质量（分辨率）就要高一点。通常数据质量更加的重要。

在这里插入图片描述

4. 视频变换

当你拿到VIDEO的时候，你需要将他缩减成对你最有用的片段，因为机器学习看不了那么长的视频
把视频压缩，但是读取比较困难
处理视频的时候，我们可以提取关键帧，而并不是输入整个视频

在这里插入图片描述

5. 文本变换

词根化(语法化)：把一个词变成常见的形式
词元化(机器学习算法中最小的单元也就是token)

在这里插入图片描述

总结：

在这里插入图片描述

关注

13
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
2.3 数据变换【李沐-斯坦福21秋季：实用机器学习中文版】

【李沐-斯坦福21秋季：实用机器学习中文版】笔记系列2.3 数据变换1.数据流程：原始数据–标注及清理–数据变形–特征工程–模型训练2. 数据归一化Max-Min Normalization算法把一个列里面的数值的最小值与最大值都限定到一个固定区间内，然后把所有的元素只通过线性变化出来【将数据的单位放到合理的区间】；Z-Score 算法：通过算法使得均值变为0，方差变为1 。把一列的数据换成是-1到1之间的数据。Decimal-Scaling 算法：使Xi➗10的阶乘，使Xi的绝对
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AiCharm 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。