自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 深度学习 II(Deep Learning II)

这样,无论输入图像的尺寸如何,GAP 层的输出都是固定大小的,方便与分类层对接。对抗性图像是一种特殊类型的输入,它们通过向原始图像添加微小的、几乎不可察觉的噪声,从而导致模型做出错误的分类或预测。通过分析最大激活区块,我们可以更好地理解神经网络模型的工作机制:哪种图像特征更可能激活某一层的神经元,以及模型是如何从这些局部特征中抽取出全局或高级的信息的。举个例子,在一个用于图像识别的CNN中,如果某一层的神经元是专门用于识别“猫耳朵”的,那么最大激活该神经元的图像区块可能就是清晰地展示了猫耳朵的图像片段。

2023-08-30 23:09:00 174 1

原创 深度学习 I(Deep Learning I)

但与此同时,CNN也可能会犯一些错误,但这些错误通常与图像的特定属性(如不常见的角度或小物体)有关,这意味着CNN在完成这些任务时确实学到了有意义的特征。这里的主要概念是,通过使用可分离的滤波器,可以减少计算的复杂性和资源消耗。特别是在移动设备上,这种方法可以提高效率和性能。虽然这种方法可能导致一些准确性的损失,但它提供了更高的计算效率和速度,特别适合资源有限的设备,如手机,或需要实时处理的应用。在卷积神经网络(CNNs)中选择合适的卷积核大小是很困难的,因为在图像中的物体或特征可能出现在任何尺度上。

2023-08-27 12:37:15 69

原创 卷积神经网络 II(Convolutional neural networks II)

降采样是将数据从一个高的采样率减少到一个低的采样率的过程。在图像处理中,降采样通常指的是减少图像的尺寸,这意味着去除图像中的某些像素以得到一个更小的版本。Image whitening (图像白化): 将每张图像缩放到0-255的范围,然后归一化,使得每个像素的均值为0,(可选的)标准差为1。因此,在实践中选择的批次大小通常取决于可用的硬件资源,尤其是GPU或CPU的内存。当验证损失不再下降时停止训练:这通常是一个早停准则,当模型在验证集上的性能不再提高时,停止训练可以防止过拟合。ceil:向上取整。

2023-08-21 10:33:43 251 1

原创 卷积神经网络 I(Convolutional neural networks I)

图像识别 (Image recognition):这里指的是对整个图像进行类别级别的识别。类别级别 (Category-level):意指按组别(group level)来识别。这种组别可以有不同的细致程度。例如,“鸟”是一个比较宽泛的类别,而“鸭子”则更为具体,再进一步,“澳大利亚木鸭”则是更为具体的分类。整个图像 (Whole image):这里的意思是每张图像只会被赋予一个标签。与此不同的是,有的识别系统可能会为图像中的每一个物体都赋予一个标签。这种类别级别的识别与。

2023-08-20 14:51:04 85 1

原创 边缘(Edge)

Invariant(不变)to X:响应/表示不随X变化,对X的变化不敏感。意味着无论X如何变化,系统或模型的响应或输出都保持不变。简单地说,它完全忽略了X的任何变化。Tolerant(容忍)to X**:响应大部分不受X的影响,对X的变化较为不敏感。意味着系统或模型的响应虽然可能受到X的一些影响,但这种影响是有限的或微小的。也就是说,它在大多数情况下可以忽略X的变化,但在极端情况下可能还是会受到一些影响。❓问题: 当光照改变的时候,用什么什么是 Invariant & Tolerant?

2023-08-13 15:14:16 144 1

原创 光和阴影(Light and shadow)

是一个与给定表面上的某点处的切面垂直的矢量。在三维空间中,任何平面(或曲面上的微小片段)都有一个与之垂直的矢量,称为该平面或曲面上该点的法向量。我们可以恢复表面法线与光源之间的夹角,但不能直接恢复法线的确切方向。使用一个矩阵 ( M ) 对 R、G、B 值进行线性变换,从而获得新的颜色空间的值,例如 XYZ。颜色的表示不仅仅是三个值,但人的眼睛(以及标准的摄像机)仅依赖于三个传感器来感知颜色。方法:假设照明变化在图像中产生低空间频率的变化,在频率域中去除照明。在不同的颜色空间之间转换颜色是直接的。

2023-08-13 12:06:56 131 1

原创 频率滤波(Frequency filtering)

傅立叶变换是一种将和分解为一堆正弦曲线(Sinusoids)的方法。

2023-08-04 15:07:06 492

原创 空间滤波(Spatial Filtering)

在高斯卷积核中,离中心像素越远的像素拥有较低的权重,而离中心像素越近的像素拥有较高的权重。因为卷积核通常比图像小,当卷积核滑动到图像边界时,无法完全覆盖卷积核的所有元素,这样会导致边界处的像素无法进行完整的卷积运算。在水平边缘上,像素值在垂直方向上的梯度较大,在垂直边缘上,像素值在水平方向上的梯度较大。均值滤波器:采用均值卷积核,其所有权重都相等,即将一个区域的像素计算平均值,然后将窗口中计算的平均值设置为锚点上的像素值。线性滤波:其中输出像素的值是输入像素的邻域中的像素值的线性组合。

2023-08-02 19:34:23 294

原创 聊一聊墨尔本大学Master of Information Technology选课

一些带着很多个人观点的选课指南 :)

2023-06-14 15:33:27 719 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除