不同类别的图像数量可视化

鲸鱼数据

https://www.kaggle.com/mmm4a1/seresnext101-pytorch-starter/edit

利用train.csv对其不同类别的图像数量进行可视化。
首先读取一下

train_df = pd.read_csv('../input/train.csv')

看一下数据的样子,我们要用到Id这一列。

train_df.head()

在这里插入图片描述
看一下一共有多少种鲸鱼图像?

NCLASSES = len(train_df['Id'].unique())
print(NCLASSES)
5005

然后使用函数统计一下,这个返回值是series类型也可以和列表一样切片。

train_df['Id'].value_counts()[:10]
new_whale    9664
w_23a388d      73
w_9b5109b      65
w_9c506f6      62
w_0369a5c      61
w_700ebb4      57
w_3de579a      54
w_564a34b      51
w_fd3e556      50
w_88e4537      49
Name: Id, dtype: int64

直接plot即可

train_df['Id'].value_counts()[1:15].plot(kind = 'bar')

在这里插入图片描述

可视化chest-xray

如果没有csv文件怎么办?
首先看一下目录结构
在这里插入图片描述
normal,pneumonia中各存了照片。我们可视化一下两个文件夹中的图像数量的柱状图。

path = '../input/chest-xray-pneumonia/chest_xray/chest_xray'

train_samplesize = pd.DataFrame.from_dict(
    {'Normal': [len([os.path.join(path+'/train/NORMAL', filename) 
                     for filename in os.listdir(path+'/train/NORMAL')])], 
     'Pneumonia': [len([os.path.join(path+'/train/PNEUMONIA', filename) 
                        for filename in os.listdir(path+'/train/PNEUMONIA')])]})

import seaborn as sns

sns.barplot(data=train_samplesize).set_title('Training Set Data Inbalance', fontsize=20)
plt.show()

这样写更方便

path = '../input/chest-xray-pneumonia/chest_xray/chest_xray'

train_samplesize = pd.DataFrame.from_dict(
    {'Normal': [len(os.listdir(path+'/train/NORMAL'))], 
     'Pneumonia': [len(os.listdir(path+'/train/PNEUMONIA'))]})

import seaborn as sns

sns.barplot(data=train_samplesize).set_title('Training Set Data Inbalance', fontsize=20)
plt.show()

在这里插入图片描述

结果是一样滴
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值