一、图像识别的本质:从像素矩阵到语义空间的跃迁
1.1 视觉信号的数字化本质
每张图片本质上是三维数组(RGB通道×高度×宽度),每个像素值对应红绿蓝三色强度。例如,一张640×480分辨率的彩色照片包含约92万组数值。传统算法依赖人工设计特征(如边缘检测、颜色直方图),而深度学习则通过卷积神经网络(CNN)自动提取特征层级。
特征类型 | 传统方法 | 深度学习方法 |
---|---|---|
每张图片本质上是三维数组(RGB通道×高度×宽度),每个像素值对应红绿蓝三色强度。例如,一张640×480分辨率的彩色照片包含约92万组数值。传统算法依赖人工设计特征(如边缘检测、颜色直方图),而深度学习则通过卷积神经网络(CNN)自动提取特征层级。
特征类型 | 传统方法 | 深度学习方法 |
---|---|---|