Kaggle实战总结（持续更新）

最新推荐文章于 2024-10-11 10:21:49 发布

qq_20880939

最新推荐文章于 2024-10-11 10:21:49 发布

阅读量707

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20880939/article/details/105481361

版权

机器学习专栏收录该内容

48 篇文章 1 订阅

订阅专栏

1. import os

这个包在加载数据时有很大作用，特别是在处理类似图像的问题时，这个包能发挥巨大的作用；

比较常用的就是两个函数：

1. os.listdir() 传入文件路径时，我们可以返回每个子文件的名字；

2. os.path.join() 将大文件的名字与子文件名字连在一起，为啥这么做？？为了获取每个子文件的每张图像的路径。。后续就通过 imread()函数读取到相应的图像。

2. import glob

这个函数与上面的 import os具有类似的作用，但这有点一步到位的意思；

# Get the list of all the images
normal_cases = normal_cases_dir.glob('*.jpeg')

上面代码中，如果把normal_cases_dir看做一个子文件夹，比如猫的子文件夹，该子文件夹下肯定包含若干张猫的照片，这里只需要使用glob函数就可以直接加载该文件夹下所有的图片了，normal_cases 返回是图片名字的列表，从根目录到每个图片的子目录。同样可以通过imread, imshow等函数可以实现图片的加载与可视化等一系列操作；

3. from keras.utils import to_categorical

这个是将标签one-hot编码的函数，将标签归一化可以手工进行完成，我们也可以将标签直接数字化，在编译函数compile()的参数

loss = "sparse_categorical_crossentropy"直接处理。

但是如果手动one-hot编码，也非常简单。

所以我们将其离散数字one-hot编码时，只需要传入y（label）与 num_classes(我们要分为多少各类，可选参数)

独热编码在拟合神经网络时是非常必要的，他消除了神经网络标签的数值大小的差异，避免了神经网络的小题大做。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。