机器学习训练营——机器学习爱好者的自由交流空间(入群联系qq:2279055353)
案例介绍
钢铁是现代工业最重要的建筑材料之一。钢铁企业对生产的钢铁进行缺陷检查,是保证钢铁产品质量的重要环节。
如今,钢铁企业使用高分辨率的平板钢铁图像,开发机器学习算法定位并分类钢铁表面的缺陷。
数据描述
本案例的任务是预测钢铁产品的缺陷类型和位置。钢铁的图像由唯一的ImageID
标识。每张图像可以没有缺陷,一个类缺陷,多个类缺陷,你必须分割每个类的缺陷。ClassId
= [1, 2, 3, 4], 每个缺陷类将编码为一个行向量。
文件
-
train_images
-
test_images
-
train.csv
数据探索
加载库
import numpy as np # linear algebra
import pandas as pd
pd.set_option("display.max_rows", 101)
import os
print(os.listdir("../input"))
import cv2
import json
import matplotlib.pyplot as plt
plt.rcParams["font.size"] = 15
import seaborn as sns
from collections import Counter
from PIL import Image
import math
import seaborn as sns
from collections import defaultdict
from pathlib import Path
import cv2
from tqdm import tqdm
导入数据集
train_df = pd.read_csv("../input/train.csv")
train_df.head()
检查钢铁缺陷类的图片数。
class_dict = defaultdict(i