在课程2中教了如何自己制作数据集开始分类任务。
- 任务为:图像分类任务
- 获得数据集的方式为下载对应url的图像,获取url的工具可以是js也可以是爬虫。
# 在这里使用课程中提供的例子 ''' 1.首先进入google image 查找图像 2.按F12,在console窗口中输入: urls = Array.from(document.querySelectorAll('.rg_di.rg_meta')).map(el=>JSON.parse(el.textContent).ou); window.open('data:text/csv;charset=utf-8,' + escape(urls.join('\n'))); 3.保存图像名称.txt文件 ''' from fastai import * from fastai.vision import * def getImg(folder, file): ''' class_:图像类名 folder:图像所在的文件夹 file:图像图片的url文件 下载图像 ''' path = Path('../bears') dest = path/folder dest.mkdir(parents=True, exist_ok=True) download_images(path/file, dest, max_pics=100) verify_images(path/folder, max_workers=8) folders = ['cats', 'dogs'] files = ['cat.txt', 'dog.txt'] for folder, file in zip(folders, files): getImg(folder, file) data = ImageDataBunch.from_folder(path, train=".", valid_pct=0.2, ds_tfms=get_transforms(), size=224, num_workers=4).normalize(imagenet_stats) data.show_batch(3) # 之后就是训练了,不想详细说了,之前笔记有