Fashion-MNIST数据集--图像数据集

Fashion-MNIST是一个包含了10个类别、每个类别下有7000张28x28像素灰度图像的数据集。这个数据集可以用于图像分类、图像识别等任务。处理这种图像数据集可以采用以下步骤:

  • 数据预处理:将数据集中的图像转换为数字矩阵形式,可以使用Python中的NumPy库进行处理。同时可以将像素值归一化到0-1范围内,方便后续处理。

  • 特征提取:对于图像数据集,常用的特征提取方法包括灰度共生矩阵、局部二值模式、方向梯度直方图等。这些特征可以帮助我们更好地描述和区分不同的图像类别。

  • 聚类分析:对于图像数据集进行聚类分析可以帮助我们发现数据中的潜在模式和结构。kmeans是一种常用的聚类算法,可以对数据进行分组,以最小化组内方差的平方和。在使用kmeans进行聚类时,需要选择适当的聚类数和距离度量方法,例如欧氏距离或曼哈顿距离等。

具体地,对于Fashion-MNIST数据集,可以先将每张28x28像素的灰度图像展开成一个784维的向量,然后使用kmeans算法进行聚类分析。在选择聚类数时,可以通过绘制不同聚类数下的聚类效果图或者使用肘部法则来确定最佳的聚类数。

需要注意的是,使用kmeans进行聚类分析只是其中的一种方法,还可以使用其他的聚类算法和特征提取方法来处理图像数据集。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.decomposition import PCA
from tensorflow.keras.datasets import fashion_mnist

# 载入数据集
(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data()

# 将图像数据展开成784维向量,并进行归一化处理
X_train = X_train.reshape(X_train.shape[0], -1) / 255.
X_test = X_test.reshape(X_test.shape[0], -1) / 255.

# 使用PCA降维到2维,便于可视化
pca = PCA(n_components=2)
X_train_pca = pca.fit_transform(X_train)

# 设置聚类数和距离度量方法,进行kmeans聚类分析
kmeans = KMeans(n_clusters=10, init='k-means++', n_init=10, max_iter=300, tol=1e-4, random_state=0)
y_pred = kmeans.fit_predict(X_train)

# 可视化聚类结果
plt.scatter(X_train_pca[:, 0], X_train_pca[</
  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Fashion-MNIST数据集是一个包含10个类别的图像数据集。这些类别分别是:t-shirt(T恤),trouser(牛仔裤),pullover(套衫),dress(裙子),coat(外套),sandal(凉鞋),shirt(衬衫),sneaker(运动鞋),bag(包),ankle boot(短靴)。 Fashion-MNIST数据集MNIST手写数据集不同,它提供了更加多样化的图像样本,为深度学习模型的训练和评估提供了更具挑战性的任务。可以通过torch.utils.data.DataLoader来读取Fashion-MNIST数据集中的小批量数据样本,该数据集也是torch.utils.data.Dataset的子类,因此可以直接传入DataLoader来创建一个数据加载器实例。 如果你想了解更多关于Fashion-MNIST数据集的内容,你可以参考相关的文档或教程,并且可以使用批量显示图像的方式来直观地了解数据集的内容。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [【深度学习系列】——Fashion-MNIST数据集简介](https://blog.csdn.net/weixin_45666566/article/details/107812603)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [PyTorch深度学习(三):Fashion-MNIST 数据集介绍](https://blog.csdn.net/weixin_48261286/article/details/121195427)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值