统计自己数据集中的mean和std

C君噢

已于 2023-12-13 11:14:44 修改

阅读量840

点赞数 8

文章标签： python 计算机视觉 pytorch

于 2022-12-09 14:58:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_55077503/article/details/128253215

版权

统计数据集中的mean和std（适用数据集所有图片在同一个文件夹下）

统计数据集中的mean和std（适用数据集所有图片在同一个文件夹下）
代码：

import os
from PIL import Image
import numpy as np
import tqdm


def main():
    # 数据集通道数
    img_channels = 3
    # 数据集路径
    img_dir = "data/voc_trainval_imgs"
    assert os.path.exists(img_dir), f"image dir: '{img_dir}' does not exist."
    # 便利数据集路径下 以.jpg为后缀的图片
    img_name_list = [i for i in os.listdir(img_dir) if i.endswith(".jpg")]
    # 累计mean和std，三个通道，这里是RGB，PIL库中的Image.open 默认RGB，cv2.imread是BGR
    cumulative_mean = np.zeros(img_channels)
    cumulative_std = np.zeros(img_channels)
    # 统计数据集长度
    print(f"INFO: {len(img_name_list)} imgs in total")
    for img_name in tqdm.tqdm(img_name_list,total=len(img_name_list)):
        img_path = os.path.join(img_dir, img_name)
        # 对数据集进行归一化
        img = np.array(Image.open(img_path)) / 255.
        # 对每个维度进行统计，Image.open打开的是HWC格式，最后一维是通道数
        for d in range(3):
            cumulative_mean[d] += img[:, :, d].mean()
            cumulative_std[d] += img[:, :, d].std()

    mean = cumulative_mean / len(img_name_list)
    std = cumulative_std / len(img_name_list)
    print(f"mean: {mean}")
    print(f"std: {std}")


if __name__ == '__main__':
    main()

输出：

>>INFO: 2913 imgs in total
100%|██████████| 2913/2913 [00:22<00:00, 129.05it/s]
mean: [0.4568465 0.44091866 0.40470575]
std: [0.236748 0.23291249 0.23822835]

Process finished with exit code 0

关注

8
点赞
踩
7

收藏

觉得还不错? 一键收藏
4
评论
统计自己数据集中的mean和std

对数据集中的mean和std进行统计，用于后续normalization，适用于txt中含有所有图片路径
复制链接

扫一扫

博客等级

码龄4年

13
原创

77
点赞

129
收藏

67
粉丝

关注

私信

热门文章

分类专栏

嵌入式系统体系结构编程与设计课程 2篇

最新评论

Edge浏览器头像不更新问题
2401_86427599: 原来那个头像还删不啦
统计自己数据集中的mean和std
C君噢: 看你自己数据是几个通道的，根据情况自己改下代码
Latex相关使用的学习
CSDN-Ada助手: 恭喜您在博客上发布了第12篇文章！学习Latex相关使用确实是一个很有意义的话题，希望您能继续分享更多关于Latex的知识和经验。建议您可以尝试写一些实用的Latex技巧或者是如何解决常见的Latex使用问题，这样会更能吸引读者的关注。期待您未来更多精彩的创作！祝您写作顺利，不断进步！
统计自己数据集中的mean和std
未尼从不加班: 报错了 IndexError: too many indices for array: array is 2-dimensional, but 3 were indexed
Edge浏览器头像不更新问题
CSDN-Ada助手: 恭喜您写了第9篇博客！标题“Edge浏览器头像不更新问题”听起来非常有趣。您对这个问题进行了深入的探索，并且能够分享您的经验和解决方案，这是非常难得的。不仅能帮助其他用户解决类似的问题，也能提高我们对Edge浏览器的使用体验。在接下来的创作中，我建议您可以进一步拓展关于Edge浏览器的问题和解决方案的主题，比如其他常见的故障、浏览器设置技巧等等。您可以通过调研、与其他用户交流或是自己的实践来获取更多的素材。这样的话，您的博客将更加丰富多样，吸引更多读者和粉丝。期待您的下一篇博客！

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。