深度学习
文章平均质量分 79
小仇学长
我们一起进步!
展开
-
Python代码中下载模块
附加:解释器环境创建流程网站原创 2023-08-09 11:49:40 · 2649 阅读 · 2 评论 -
在Pycharm中创建项目新环境,安装Pytorch
在python项目中,很多项目使用的各类包的版本是不一致的。所以我们可以对每个项目有专属于它的环境。所以这个文章就是教你如何创建新环境。原创 2023-11-24 19:49:21 · 1599 阅读 · 0 评论 -
在Anaconda中用命令行安装环境以及安装包
复制这条命令并在后面加入清华源,在命令行中进行下载。找到项目需要的torch版本。比如运行桌面上的代码。原创 2023-11-28 16:17:33 · 818 阅读 · 0 评论 -
什么是Anaconda?作用是?使用python必须要安装嘛?
通俗来讲,Anaconda算是一个环境容器,也可以叫环境管理器。作用:可以在Anaconda容器中为python项目创建不同的环境。在各个不同环境中可以安装不同版本的包并且各个环境互不影响。可以在使用不同项目时任意切换所用环境。原创 2023-11-30 21:15:18 · 1601 阅读 · 0 评论 -
yolov数据集增强并扩充(xml文件一起扩充)
代码只需要修改源文件路径、保存文件路径即可。原创 2024-04-20 20:07:11 · 259 阅读 · 0 评论 -
深度学习实践(一)基于Transformer英译汉模型
数据集可以去网络上下载,下面的是train.txt文件部分内容,前面为英文,后面为繁体中文,中间以。作用:读取数据路径下的完整句子,并将其分割为一个一个的单词,并存到列表中返回。enumerate(可迭代元素),返回的第一个值为索引,第二个值为元素。这里数据集是英文和繁体中文,所以第一步我们需要将繁体中文变为简体中文。将sentences里面每句话的每个单词组合形成一个新的列表。其他数据文件也相同。原创 2024-04-09 22:32:46 · 687 阅读 · 0 评论 -
深度学习理论基础(七)Transformer编码器和解码器
但是Transformer 的是完全基于self-Attention地,而self-attention是不能获取词语位置信息的,就算打乱一句话中词语的位置,每个词还是能与其他词之间计算attention值,就相当于是一个功能强大的词袋模型,对结果没有任何影响。它允许模型在输入序列中学习词与词之间的依赖关系,通过计算每个词对其他词的注意力权重来实现。编码器的作用是将输入序列转换为语义表示,学习输入序列中词与词之间的依赖关系,并提取输入序列的特征表示,为解码器生成目标序列提供有用的信息。原创 2024-04-07 18:54:14 · 1088 阅读 · 0 评论 -
深度学习理论基础(六)Transformer多头自注意力机制
深度学习中的注意力机制(Attention Mechanism)是一种模仿人类视觉和认知系统的方法,它允许神经网络在处理输入数据时集中注意力于相关的部分。通过引入注意力机制,神经网络能够自动地学习并选择性地关注输入中的重要信息,提高模型的性能和泛化能力。下图 展示了人类在看到一幅图像时如何高效分配有限注意力资源的,其中红色区域表明视觉系统更加关注的目标,从图中可以看出:人们会把注意力更多的投入到人的脸部。常见方法:求两者的向量点积(内积)、求两者向量Cosine相似性、引入额外的神经网络求值(MLP)。原创 2024-04-02 22:13:11 · 635 阅读 · 0 评论 -
深度学习理论基础(五)卷积神经网络CNN
卷积神经网络是一种多层的监督学习神经网络,隐含层的卷积层和池采样层是实现卷积神经网络特征提取功能的核心模块。卷积神经网络结构包括:卷积层,降采样层,全链接层。每一层有多个特征图,每个特征图通过一种卷积滤波器提取输入的一种特征,每个特征图有多个神经元。原创 2024-04-02 13:57:23 · 891 阅读 · 0 评论 -
深度学习理论基础(四)Parser命令行参数模块
使用命令行运行.py文件时, 可以直接在后面给参数赋值, 而不用打开文件修改变量值。在无界面调试(没有pycharm工具)时非常方便,不需要经常修改文件中变量的值,只需要通过命令行修改即可。参数若是变量:default=[默认值]:可以填写变量的默认值。参数若是文件:default=[默认值]:可以填写文件路径。将上面parser中添加的所有参数封装为参数列表args。本程序名为number.py。原创 2024-04-01 20:51:23 · 529 阅读 · 0 评论 -
深度学习理论基础(三)封装数据集及手写数字识别
在封装我们的数据集时,必须继承实用工具(utils)中的 DataSet 的类,这个过程需要重写__init__和__getitem__、__len__三个方法,分别是为了加载数据集、获取数据索引、获取数据总量。C表示通道数,二维灰度图像的通道数为 1,三维 RGB 彩图的通道数为 3。new_model使用了原有模型文件,我们就需要在测试网络的前向传播中的模型修改为 new_model去进行测试。导入训练好的模型文件,我们就不需要再进行训练网络,直接使用测试网络来测试即可。测试网络不需要回传梯度。原创 2024-04-01 19:50:07 · 701 阅读 · 0 评论 -
深度学习理论基础(二)深度神经网络DNN
神经网络通过学习大量样本的输入与输出特征之间的关系,以拟合出输入与输出之间的方程,学习完成后,只给它输入特征,它便会可以给出输出特征。神经网络可以分为这么几步:划分数据集、训练网络、测试网络、使用网络。神经网络的训练过程,就是经过很多次前向传播与反向传播的轮回,最终不断调整其内部参数(权重 ω 与偏置 b),以拟合任意复杂函数的过程。内部参数一开始是随机的(如 Xavier 初始值、He 初始值),最终会不断优化到最佳。神经网络:普通神经网络(NN)、卷积神经网络(CNN)。原创 2024-03-31 22:56:00 · 1150 阅读 · 0 评论 -
深度学习理论基础(一)Python及Torch基础篇
''' '''""" """Ctrl+/Python 里换行符(回车)可以替代分号(;),所以一般不出现分号;Python 是动态输入类型的语言,像 Matlab 一样,变量类型是动态推断的;静态类型的 C 语言须声明变量类型,如 int a = 1,而 Python 只需要 a = 1;Python中代码包含关系使用来表示,而不是使用括号来进行包含。原创 2024-03-31 12:41:30 · 603 阅读 · 0 评论