FER-2013数据集下载: FER-2013数据集的具体下载方式可以参考博客:https://editor.csdn.net/md/?articleId=123421725
FER-2013数据集结构:
- 下载后的数据集为一个压缩文件,如下所示:
- 对其进行解压得到如下,其中fer2013.csv是最重要的,其他两个都是在说引用文献及引用格式的事。
- fer2013.csv的内容如下,包括了图像的情绪类别(0-6分别代表着6种基本情绪+中性)、图像的像素值(图像大小为48*48)、图像用途(Training、PublicTest和PrivateTest)。
提取表情图像:
#encoding:utf-8
import pandas as pd
import numpy as np
from PIL import Image
import os
emotions = {
'0':'anger', #生气
'1':'disgust', #厌恶
'2':'fear', #恐惧
'3':'happy', #开心
'4':'sad', #伤心
'5':'surprised', #惊讶
'6':'netural', #中性
}
#创建文件夹
def createDir(dir):
if os.path.exists(dir) is False:
os.makedirs(dir)
def saveImageFromFer2013(file):
#读取csv文件
faces_data = pd.read_csv(file)
imageCount = 0
#遍历csv文件内容,并将图片数据按分类保存
for index in range(len(faces_data)):
#解析每一行csv文件内容
emotion_data = faces_data.loc[index][0]
image_data = faces_data.loc[index][1]
usage_data = faces_data.loc[index][2]
#将图片数据转换成48*48
data_array = list(map(float, image_data.split()))
data_array = np.asarray(data_array)
image = data_array.reshape(48, 48)
#print (image)
#选择分类,并创建文件名
dirName = usage_data
#dirName = 'E:\\fer2013'+'./'+usage_data
emotionName = emotions[str(emotion_data)]
#图片要保存的文件夹
imagePath = os.path.join(dirName, emotionName)
#imagePath = dirName+'./'+emotionName
# 创建“用途文件夹”和“表情”文件夹
createDir(dirName)
createDir(imagePath)
#图片文件名
imageName = os.path.join(imagePath, str(index) + '.png')
image = Image.fromarray(image)
#print(image.mode)
#注意上面的data_array = list(map(float, image_data.split()))如果这里为float,则image.mode为F,若这里为int,则image.mode为I,首先F是无法转为jpg或png的
#其次F和I都是32位的,而电脑只能看8位的,因此,需要转为L(8位)
image = image.convert('L') #电脑只能显示8个bit的,所以要转为‘L'。这里不懂的可以去看看image的mode是什么,以及不同的mode分别是什么情况
image.save(imageName)
imageCount = index
print('总共有' + str(imageCount) + '张图片')
if __name__ == '__main__':
saveImageFromFer2013(r'E:\fer2013\fer2013.csv')
Python中PIL的9种不同模式
mode | Introduce |
---|---|
1 | 模式“1”为二值图像,非黑即白。但是它每个像素用8个bit表示,0表示黑,255表示白。 |
L | 模式“L”为灰色图像,它的每个像素用8个bit表示,0表示黑,255表示白,其他数字表示不同的灰度。在PIL中,从模式“RGB”转换为“L”模式是按照下面的公式转换的:L = R * 299/1000 + G * 587/1000+ B * 114/1000 |
P | 模式“P”为8位彩色图像,它的每个像素用8个bit表示,其对应的彩色值是按照调色板查询出来的。 |
RGB | 模式“RGB”(RED,GREEN,BLUE) |
RGBA | 模式“RGBA”为32位彩色图像,它的每个像素用32个bit表示,其中24bit表示红色、绿色和蓝色三个通道,另外8bit表示alpha通道,即透明通道。 |
CMYK | 模式“CMYK”为32位彩色图像,它的每个像素用32个bit表示。模式“CMYK”就是印刷四分色模式,它是彩色印刷时采用的一种套色模式,利用色料的三原色混色原理,加上黑色油墨,共计四种颜色混合叠加,形成所谓“全彩印刷”。四种标准颜色是:C:Cyan = 青色,又称为‘天蓝色’或是‘湛蓝’M:Magenta = 品红色,又称为‘洋红色’;Y:Yellow = 黄色;K:Key Plate(blacK) = 定位套版色(黑色)。PIL中“RGB”转换为“CMYK”的公式如下:C = 255 - R,M = 255 - G,Y = 255 - B,K = 0 |
YCbCr | 模式“YCbCr”为24位彩色图像,它的每个像素用24个bit表示。YCbCr其中Y是指亮度分量,Cb指蓝色色度分量,而Cr指红色色度分量。人的肉眼对视频的Y分量更敏感,因此在通过对色度分量进行子采样来减少色度分量后,肉眼将察觉不到的图像质量的变化。模式“RGB”转换为“YCbCr”的公式如下:Y= 0.257R+0.504G+0.098B+16,Cb = -0.148R-0.291G+0.439B+128,Cr = 0.439R-0.368G-0.071*B+128 |
I | 模式“I”为32位整型灰色图像,它的每个像素用32个bit表示,0表示黑,255表示白,(0,255)之间的数字表示不同的灰度。在PIL中,从模式“RGB”转换为“I”模式是按照下面的公式转换的:I = R * 299/1000 + G * 587/1000 + B * 114/1000 |
F | 模式“F”为32位浮点灰色图像,它的每个像素用32个bit表示,0表示黑,255表示白,(0,255)之间的数字表示不同的灰度。在PIL中,从模式“RGB”转换为“F”模式是按照下面的公式转换的:F = R * 299/1000+ G * 587/1000 + B * 114/1000 |
电脑位深度查询
- 可以看到,电脑位深度只有8位。因此对于像素值为70的点来说,如果将它存为32位,再用深度只有8位的电脑显示,则基本就是漆黑一片。所以在用8位深度的电脑进行显示之前,要先将32位转为8位,再进行显示。
永远相信美好的事情即将发生🎈