Machine Learning Homework 3 - Image Sentiment Classification Kaggle题解报告（基于pytorch架构）

最新推荐文章于 2020-08-12 16:30:53 发布

hit_zc

最新推荐文章于 2020-08-12 16:30:53 发布

阅读量1.1k

点赞数

分类专栏： CNN ML kaggle 文章标签： kaggle Image Sentiment Classification pytorch CNN

本文链接：https://blog.csdn.net/baidu_20965275/article/details/83473173

版权

本文介绍了使用PyTorch构建CNN模型解决Kaggle上的Image Sentiment Classification任务。首先，根据train.csv创建数据集，将图片数据转换为48x48像素的浮点数列表，并存储对应的标签。接着，设计CNN网络结构，调整超参数以避免过拟合。在训练过程中，从训练集划出验证集进行评估。最后，将模型应用于test.csv，生成sample.csv提交预测结果。

摘要由CSDN通过智能技术生成

题目：

我們提供給各位的training dataset為兩萬八千張左右48x48 pixel的圖片，以及每一張圖片的表情label（注意：每張圖片都會唯一屬於一種表情）。總共有七種可能的表情（0：生氣, 1：厭惡, 2：恐懼, 3：高興, 4：難過, 5：驚訝, 6：中立(難以區分為前六種的表情))。

Testing data則是七千張左右48x48的圖片，希望各位同學能利用training dataset訓練一個CNN model，預測出每張圖片的表情label（同樣地，為0~6中的某一個）並存在csv檔中。

分析：

1.首先根据train.csv构造自己的数据集

由于每张图片的feature位于一个单元格中，所以首先要用spilt()把数字字符串数据转换成48*48大小的数值型列表，此时要注意数值类型必须为float类型

import pandas as pd
data=pd.read_csv(‘data/train.csv’)
image=data.iloc[idx,1].split()
image=list(map(float,image))
image=np.array(image).reshape(-1,48)

image有了，接下来就是存储lable了，lable是0-6的int型整数.