自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

2301_79482106的博客

原创 Datawhale X 李宏毅苹果书 AI夏令营

汇聚（Pooling）：通常在卷积层后使用，用于减少特征图的尺寸，从而降低计算量。下采样（Downsampling）：通过去掉偶数列和奇数行，将图像尺寸缩小为原来的1/4，仍然保持图像中的重要信息。这一过程不会影响模式的检测。在卷积层中，不同神经元共享同一组参数（权重），这使得网络能够检测到不同位置的相同特征，从而减少模型复杂度和计算量。图像可以表示为一个三维张量，其中两个维度表示图像的宽和高，第三个维度表示颜色通道（通常是RGB）。这种操作的优点是允许更高的学习率，同时引入轻微的噪声，有助于模型泛化。

2024-09-02 22:13:27 1320

原创 Datawhale夏令营第五期——CV方向 TASK3

旋转（Rotation）：随机旋转图像以改变其方向。缩放（Scaling）：改变图像的大小。剪裁（Cropping）：从图像中随机剪裁出一个区域。翻转（Flipping）：水平或垂直翻转图像。裁剪（Clipping）：裁剪掉图像边缘的某些部分。颜色抖动（Color Jittering）：随机调整图像的亮度、对比度和饱和度。高斯噪声（Gaussian Noise）：向图像中添加随机的高斯噪声。锐化（Sharpening）：增强图像的边缘和细节。

2024-08-31 21:51:15 304

原创 Datawhale X 李宏毅苹果书 AI夏令营

最终进化完全的更新迭代方式就是像下图一样，其中学习率随迭代变化，更新方向为之前梯度的加权和。

2024-08-31 16:29:58 397

原创 Datawhale夏令营第五期——CV方向 TASK2

其中yolov8的不同版本（N、S、M、L、X）主要是在模型大小、推理速度、准确度以及计算复杂度等方面有所区别。task1中使用的版本是yolov8n，也就是最小的模型。对于task1中的模型，第一个改进的地方是增加训练集，将使用五个视频改为十个视频用于训练集。首先在不改动任何参数的情况下尝试了yolov8m（中等版），取得了一个和n版完全一致的结果。最小的模型，参数量最少，计算速度最快，但准确度相对较低。最大的模型，拥有最多的参数，推理速度最慢，但准确度最高。适用于需要平衡速度和准确度的场景。

2024-08-29 22:11:26 279

原创 Datawhale X 李宏毅苹果书 AI夏令营

TASK1主要是对于3.1节各种不同的局部极小值以及3.2节中在梯度下降法中涉及的批与动量等概念的学习。

2024-08-27 19:40:41 414

原创 Datawhale夏令营第五期——CV方向 TASK1

本赛题最终目标是开发一套智能识别系统，能够自动检测和分类城市管理中的违规行为。该系统应利用先进的图像处理和计算机视觉技术，通过对摄像头捕获的视频进行分析，自动准确识别违规行为，并及时向管理部门发出告警，以实现更高效的城市管理。数据为mp4格式，标注文件为json格式，每个视频对应一个json文件。json文件的内容是每帧检测到的违规行为，包括以下字段：frame_id：违规行为出现的帧编号event_id：违规行为IDcategory：违规行为类别。

2024-08-26 21:51:02 394

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除