- 博客(6)
- 收藏
- 关注
原创 Datawhale X 李宏毅苹果书 AI夏令营
汇聚(Pooling):通常在卷积层后使用,用于减少特征图的尺寸,从而降低计算量。下采样(Downsampling):通过去掉偶数列和奇数行,将图像尺寸缩小为原来的1/4,仍然保持图像中的重要信息。这一过程不会影响模式的检测。在卷积层中,不同神经元共享同一组参数(权重),这使得网络能够检测到不同位置的相同特征,从而减少模型复杂度和计算量。图像可以表示为一个三维张量,其中两个维度表示图像的宽和高,第三个维度表示颜色通道(通常是RGB)。这种操作的优点是允许更高的学习率,同时引入轻微的噪声,有助于模型泛化。
2024-09-02 22:13:27 1320
原创 Datawhale夏令营第五期——CV方向 TASK3
旋转(Rotation): 随机旋转图像以改变其方向。缩放(Scaling): 改变图像的大小。剪裁(Cropping): 从图像中随机剪裁出一个区域。翻转(Flipping): 水平或垂直翻转图像。裁剪(Clipping): 裁剪掉图像边缘的某些部分。颜色抖动(Color Jittering): 随机调整图像的亮度、对比度和饱和度。高斯噪声(Gaussian Noise): 向图像中添加随机的高斯噪声。锐化(Sharpening): 增强图像的边缘和细节。
2024-08-31 21:51:15 304
原创 Datawhale夏令营第五期——CV方向 TASK2
其中yolov8的不同版本(N、S、M、L、X)主要是在模型大小、推理速度、准确度以及计算复杂度等方面有所区别。task1中使用的版本是yolov8n,也就是最小的模型。对于task1中的模型,第一个改进的地方是增加训练集,将使用五个视频改为十个视频用于训练集。首先在不改动任何参数的情况下尝试了yolov8m(中等版),取得了一个和n版完全一致的结果。最小的模型,参数量最少,计算速度最快,但准确度相对较低。最大的模型,拥有最多的参数,推理速度最慢,但准确度最高。适用于需要平衡速度和准确度的场景。
2024-08-29 22:11:26 279
原创 Datawhale X 李宏毅苹果书 AI夏令营
TASK1主要是对于3.1节各种不同的局部极小值以及3.2节中在梯度下降法中涉及的批与动量等概念的学习。
2024-08-27 19:40:41 414
原创 Datawhale夏令营第五期——CV方向 TASK1
本赛题最终目标是开发一套智能识别系统,能够自动检测和分类城市管理中的违规行为。该系统应利用先进的图像处理和计算机视觉技术,通过对摄像头捕获的视频进行分析,自动准确识别违规行为,并及时向管理部门发出告警,以实现更高效的城市管理。数据为mp4格式,标注文件为json格式,每个视频对应一个json文件。json文件的内容是每帧检测到的违规行为,包括以下字段:frame_id:违规行为出现的帧编号event_id:违规行为IDcategory:违规行为类别。
2024-08-26 21:51:02 394
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人