- 博客(15)
- 收藏
- 关注
原创 小易的yolo学习笔记2
YOLOV1YOLOV2YOLOV3YOLOV4目标检测是计算机视觉中的一个重要任务,它不仅要识别图像中有什么物体,还要确定这些物体在图像中的具体位置(用边界框表示)简单类比:就像人类看一张照片时,不仅能认出"这是一只猫",还能指出"猫在图片的左上角区域"技术定义:给定一张图像,目标检测需要:在YOLO出现之前,主流的目标检测方法(如R-CNN系列)存在以下问题:R-CNN(2014):Fast R-CNN(2015):Faster R-CNN(2016):YOLO的出现彻底改变了目标检测的范式:核心创新:
2025-08-05 19:03:47
773
原创 小易的yolo学习笔记1
用途:手写数字识别规模:60,000训练 + 10,000测试,28×28灰度图特点:相对简单,适合初学者入门计算机视觉项目的第一个练习数据集网址✅ 理解目标检测的核心任务(定位+识别)✅ 掌握两种技术架构(两阶段vs单阶段)✅ 熟悉关键评估指标(IoU、mAP、FPS)
2025-07-31 17:43:55
911
原创 小易的卷积神经网络学习笔记3
模型代码直接下载模型评估标准的核心其实就是衡量一个模型的好坏,合适的评价指标可以帮助我们准确地衡量模型的性能,从而进行优化和改进。在训练CNN模型时,如何判断模型的好坏?这就需要用到一系列评估标准。常见的有:准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1-Score)、混淆矩阵、ROC曲线与AUC值等。真正例(TP):模型正确预测为正类的样本数量真负例(TN):模型正确预测为负类的样本数量假正例(FP):模型错误预测为正类的样本数量假负例(
2025-07-25 18:46:39
666
原创 小易的卷积神经网络学习笔记2
MNIST是最常用的手写数字图片数据集,包含0-9共10类,每张图片为28x28灰度图。训练集:60,000张测试集:10,000张return x小结:自定义CNN结构灵活,适合多种图像任务。知识点关键内容MLP全连接结构,适合结构化数据LeNet卷积+池化+全连接,图像识别经典结构卷积层提取空间特征,参数共享,局部连接池化层降低维度,增强特征鲁棒性全连接层整合特征,输出分类结果简化线性网络结构边缘检测CNN利用固定卷积核提取边缘特征可视化。
2025-07-23 17:52:55
381
原创 小易的卷积神经网络学习笔记1
卷积神经网络(Convolutional Neural Network,CNN)是一类专门用于处理具有类似网格结构数据(如图像)的深度学习模型。它的灵感来源于生物学中的感受野机制,能够自动提取数据中的空间特征。(有时候也成为汇聚)。这些特性使得卷积神经网络具有一定程度上的平移、缩放和旋转不变性。和前馈神经网络相比,卷积神经网络的参数也更少。因此,通常会使用卷积神经网络来处理图像信息。:每个神经元只关注输入数据的一个小区域(如图像的一小块),而不是全部。
2025-07-22 13:51:17
721
原创 小易的全连接神经网络笔记2
激活函数的作用是在隐藏层引入非线性,使得神经网络能够学习和表示复杂的函数关系,使网络具备非线性能力,增强其表达能力。我们可以通过可视化的方式去理解非线性的拟合能力:https://playground.tensorflow.org/如果在隐藏层不使用激活函数,那么整个神经网络会表现为一个线性模型。我们可以通过数学推导来展示这一点。假设:一层网络的情况对于单层网络(输入层到输出层),如果没有激活函数,输出a(1)\mathbf{a}^{(1)}a(1) 可以表示为:a(1)=W(1)x+b(1)\mathb
2025-07-18 10:52:03
650
原创 小易的全连接神经网络笔记1
Dataset是一个抽象类,是所有自定义数据集应该继承的基类。它定义了数据集必须实现的方法。必须实现的方法__len__: 返回数据集的大小: 支持整数索引,返回对应的样本# 用于初始化数据集对象:通常在这里加载数据,# 或者定义如何从存储中获取数据的路径和方法# 返回样本数量:需要实现,以便 Dataloader加载器能够知道数据集的大小# 根据索引返回样本:将从数据集中提取一个样本,并可能对样本进行预处理或变换。
2025-07-16 19:58:49
479
原创 小易的深度学习.Torch框架笔记
人工智能(Artificial Intelligence, AI)是让计算机像人一样“思考”和“学习”的技术。它的目标是让机器能够模拟、延伸和扩展人类的智能,包括感知、理解、推理、决策和解决问题。就像人类通过眼睛看、耳朵听、大脑思考,AI让计算机也能“看图识物”、“听声辨人”、“下棋决策”等。PyTorch 是由 Facebook 开发的主流深度学习框架,广泛应用于学术研究和工业界。它以“易用、灵活、动态计算图”著称,非常适合初学者和科研人员。
2025-07-14 17:15:51
1063
原创 小易的python基础语法笔记2
使用def# 函数体# 进行一些操作return result # 可选的返回值def是 Python 中用于声明函数的关键字,当 Python 解释器遇到def时,它就知道接下来要定义一个函数。函数名,是一个有效的标识符,命名规则和变量名一致(函数名应该具有描述性,能够清晰地表达函数的功能,以便于代码的阅读和理解)parameters形参(形式参数),可以有 0 个到多个,参数之间用逗号分隔(形参是在函数定义时声明的变量,它们在函数被调用时接收传递进来的实际参数(实参)的值)
2025-03-17 17:29:32
1222
原创 小易的机器学习笔记
明确业务需求:与相关利益者(如业务部门、客户等)沟通,了解项目的具体目标和业务需求(例如,是要进行客户分类、销售预测还是图像识别等)确定问题类型:根据业务需求,确定问题属于监督学习、无监督学习还是强化学习等类型。不同类型的问题需要采用不同的算法和评估指标。
2025-02-20 20:03:56
1511
原创 小易的OpenCV-图像预处理学习笔记
图像掩模是一种图像处理技术,其核心作用是创建一个掩模(mask),这个掩模可以理解为与原图像大小相同的图像,只不过它的像素值通常只有两种状态(二值图像),用于屏蔽或突出原图像中的特定区域。主要目的是通过掩模提取图像中特定颜色的区域cv2.bitwise_and() 函数用于对两个图像进行按位与操作,这个操作会逐个像素地对两个输入图像进行比较,只有在两个像素均为 255(白色)时,输出的像素才会为 255(白色),否则输出为 0(黑色)。这种特性使得它在掩膜和图像分割等任务中发挥着重要作用。
2025-02-18 20:08:27
1726
原创 小易的OpenCV-图像基础学习笔记
cv2.circle() 函数用于在图像上绘制圆形cv2.rectangle()函数用于在图像上绘制矩形cv2.putText()函数用于在图像上添加文本cv2.line()函数用于在图像上绘制直线9.2.1 read() 方法功能:从视频源中读取下一帧返回值:返回一个布尔值ret和图像帧frame。布尔值ret表示是否成功读取了帧,如果成功读取则为True,否则为False;图像帧frame是一个 NumPy 数组,代表当前读取的视频帧图像在循环中逐帧读取视频时使用,通过判断ret。
2025-02-16 20:47:17
1147
原创 小易的Numpy学习笔记
NumPy 提供了比 Python 更加丰富的数据类型(3intc和 C 语言的 int 类型一样,一般是 int32 或 int 644intp用于索引的整数类型(类似于 C 的 ssize_t,通常为 int32 或 int64)17complex_复数类型,与 complex128 类型相同18complex64表示实部和虚部共享 32 位的复数19complex128表示实部和虚部共享 64 位的复数22string_表示字节串类型,等价于bytes_
2025-02-07 19:57:10
1111
原创 小易的Pandas学习笔记
结构特点:DataFrame 是一个表格型的数据结构,具有行标签(index)和列标签(columns),也被称为异构数据表,即每列的数据类型可以不同,如字符串、整型、浮点型等。各参数含义data一组数据 ,可以是多种数据类型,如 ndarray、series、map、lists、dict 等。index索引值(即行标签)。columns列标签,默认为RangeIndexdtype数据类型。copy默认为 False,表示复制数据data。与 Series 的关系。
2025-02-07 19:53:59
1054
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅