【cs231n】Lecture 2 : Image Classification pipeline 图像分类管道

本文介绍了计算机视觉中核心任务——图像分类,探讨了数据驱动方法,重点讲解了K-Nearest Neighbor (KNN) 分类器的工作原理,包括CIFAR10数据集的使用、距离度量和超参数设置。同时,提到了线性分类器如SVM和Softmax,以及两层神经网络作为更复杂的模型。
摘要由CSDN通过智能技术生成

Assignment 1

  • K - Nearest Neighbor (k - 最近邻分类器)
  • Linear classifiers (线性分类器) :SVM,Softmax
  • Two - layer neural network (两层神经网络)
  • Image Features (图像特征)

Ⅰ. Image Classification : A core task in Computer Vision

  • The problem : Semantic Gap (语义鸿沟)
  • Challenges : Viewpoint variation (视角变化)
  • Challenges : Occlusion (包藏)
  • Challenges: Background Clutter (背景混乱)

Ⅱ. Data-driven Approach (数据驱动方法)

  1. Collect a dataset of images and labels
  2. Use Machine Learning to train a classifier
  3. Evaluate the classifier on new images
def train(images, labels):
	# Machine Learning!
	return model;
def predict(images, labels):
	# Use model to predict labels
	return test_labels;

First classifier : Nearest Neighbor (近邻分类器)

The function is usually used to memorize all data and labels

def train(images, labels):
	# Machine Learning!
	return model;

The function is usually used to predict the label of the most similar training image

def predict(images, labels):
	# Use model to predict labels
	return test_labels;

Example Dateset : CIFAR10

  • 10 classes
  • 50,000 training images
  • 10,000 testing images

Distance Metric to compare images

L

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值