江东-CSDN博客

原创对Transformer中Add&Norm层的理解

首先我们还是先来回顾一下Transformer的结构：Transformer结构主要分为两大部分，一是Encoder层结构，另一个则是Decoder层结构，Encoder 的输入由 Input Embedding 和 Positional Embedding 求和输入Multi-Head-Attention，再通过Feed Forward进行输出。

2022-10-09 22:02:01 25099 11

原创 Transformer总结和梳理

首先来看一下Transformer结构的结构：Transformer是由Encoder和Decoder两大部分组成，首先我们先来回顾一下Transformer的结构：Transformer结构主要分为两大部分，一是Encoder层结构，另一个则是Decoder层结构。

2022-11-20 23:54:34 2976 1

原创对Transformer中的MASK理解

上一篇文章我们介绍了，今天我们来介绍一下对MASK的理解老规矩，还是先放一张Transformer的图片Transformer结构主要分为两大部分，一是Encoder层结构，另一个则是Decoder层结构，而所谓的MASK在Encoder和Decoder两个结构中都有使用。Transformer中的MASK主要分为两部分：Padding Mask和Sequence Mask两部分。

2022-11-14 19:39:01 4884

原创对Transformer中FeedForward层的理解

今天来说一下Transformer中FeedForward层，首先还是先来回顾一下Transformer的基本结构：首先我们还是先来回顾一下Transformer的结构：Transformer结构主要分为两大部分，一是Encoder层结构，另一个则是Decoder层结构，Encoder 的输入由 Input Embedding 和 Positional Embedding 求和输入Multi-Head-Attention，然后又做了一个ADD&Norm，再通过Feed Forward进行输出。

2022-10-10 21:05:16 36869 8

原创对Transformer中self-attention的理解

首先我们来看一下Transformer架构：对于input输出，首先进行input embedding，然后再进行positional encoding，将两者相加作为Encoder的输入，也就是输如X何为self-attention？首先我们要明白什么是attention，对于传统的seq2seq任务，例如中-英文翻译，输入中文，得到英文，即source是中文句子（x1 x2 x3）,英文句子是target（y1 y2 y3）

2022-10-08 11:47:04 2485

原创对Transformer中Positional Encoding的理解

Transformer是由Encoder和Decoder两大部分组成，首先对于文本特征，需要进行Embedding，由于transformer抛弃了Rnn的结构，不能捕捉到序列的信息，交换单词位置，得到相应的attention也会发生交换，并不会发生数值上的改变，所以要对input进行Positional Encoding。Positional encoding和input embedding是同等维度的，所以可以将两者进行相加，的到输入向量。

2022-10-07 12:34:16 2426

原创怎么理解预训练模型？

预训练“的做法一般是将大量低成本收集的训练数据放在一起，经过某种预训方法去学习其中的共性，然后将其中的共性“移植”到特定任务的模型中，再使用相关特定领域的少量标注数据进行“微调”，这样的话，模型只需要从”共性“出发，去“学习”该特定任务的“特殊”部分即可。

2022-10-06 11:21:14 3463

原创 HuggingFace的安装和编码

加载预训练模型bert-base-chinese，初次加载可能需要较长的时间。

2022-10-05 11:19:05 2809 1

原创 Python切换源，快速下载文件

python安装包很慢？不存在的，直接修改配置文件！

2022-09-05 23:50:40 1839

原创 SOFTMAX回归模型

SOFTMAX函数的脉络梳理什么是SOFTMAX回归函数交叉熵损失函数什么是SOFTMAX回归函数·softmax回归跟线性回归⼀样将输⼊特征与权᯿做线性叠加·与线性回归的⼀个主要不同在于，softmax回归的输出值个数等于标签⾥的类别数·SOFTMAX是一个单层的神经网络结构图如下：运算过程如下：即我们通过神经网络预测，然后得到相应的一个分数，此时我们希望我们得到的分数是一个概率：此时我们就应该选取一个合适的方案，来将预测的分数来转化为标签的概率，那么最合适的肯定是softmax了，

2022-05-07 13:33:02 2176

原创 d2lzh_pytorch包离线安装

安装d2lzh_pytorch

2022-05-07 11:00:38 2351 1

原创线性回归的简洁实现

简洁实现线性回归

2022-04-25 23:45:55 3241

原创史上最详细的Pytorch+CUDA+CUDNN的安装(GPU版)

完整地安装Pytorch，CUDA,CUDNN,并附带教程，欢迎查看！！！

2022-04-25 11:18:19 34946 17

原创 Pytorch线性回归的详细实现

线性回归单层神经网络-线性回归代码实现：线性回归是⼀个单层神经⽹络输⼊分别为x1和x2，因此输⼊层的输⼊个数为2,输⼊个数也叫特征数或特征向量维度,输出层的输出个数为1,输出层中的神经元和输⼊层中各个输⼊完全连接,因此，这⾥的输出层⼜叫全连接层,即一个简单地线性回归。假设我们有三个预测数据：转化为矩阵运算：即代码实现：首先导入所需要的包：import torchimport randomimport numpy as npfrom tqdm im

2022-04-21 23:22:26 2427

原创 Pytorch自动求梯度

求梯度微分Pytorch自动微分微分通常我们见到的微分方法有两种：·符号微分法：·数值微分法：Pytorch自动微分对于一个Tensor，如果它的属性requires_grad 设置为 True，它将开始追踪(track)在其上的所有操作我们定义一个初始的tensor并且requires_grad 设置为 True：x = torch.ones(2, 2, requires_grad=True)print(x)tensor([[1., 1.], [1., 1.]]

2022-04-19 09:40:33 2384

原创 Pytorch中Tensor的创建

Tensor的基本的几种创建方式，欢迎查看

2022-04-17 23:31:41 2181

原创使用anacond prompt安装pytorch(CPU版)

使用anacond prompt安装pytorch使用anacond prompt安装pytorch使用anacond prompt安装pytorch·首先去anaconda官网安装anaconda，然后打开anaconda prompt（pycharm配置环境略过）：在命令行输入：Conda create –n pytorch python=3.8来创建一个关于pytorch的单独环境这里的‘pytorch’是环境名称，python=3.8是版本，都可以根据需求自行修改然后就可以进入我们创

2022-04-16 23:20:58 2873 1

原创快速安装python包

使用以下代码pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 在最后加上你要安装的包，就OK了例如：pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas

2021-12-08 15:46:25 1344

原创 Python修改论文的字体及其大小

Word文档修改对标题的格式修改对文章内容对修改对标题的格式修改·首先是导入包和读取word文档from docx import Documentimport refrom docx.shared import Pt, RGBColor # 字号，颜色from docx.oxml.ns import qn # 中文字体file = Document("E:\\File\\大一\\大一下学期/马克思.docx")然后对字体进行修改for run in file.paragraphs:

2021-11-25 11:13:08 2125

原创 python读取word文档

基本的读取操作读取文件内容输出文章的标题输出文章的1级标题输出文章的多级标题输出正文输出段落内容：输出一段的内容输出所有段落的内容保存文章读取文件内容from docx import Documentfile = Document("E:\\File\\大一\\大一下学期/马克思.docx")我们直接输出文章内容是不可以的：print(file)# <docx.document.Document object at 0x000002686EE048C0>我们可以使用循环的方式进

2021-11-25 10:48:51 2757

原创 KNN实现手写字体的识别

KNN实现手写字体的识别KNN算法介绍：数据的导入：导入包导入数据集数据集介绍：数据集的分割：定义KNN函数：评估准确率：完整代码：KNN算法介绍：点击这里查看KNN算法代码及其介绍数据的导入：导入包from sklearn import datasetsimport matplotlib.pyplot as pltimport numpy as npimport cv2from sklearn.model_selection import train_test_splitimport

2021-11-23 12:02:53 2824

原创判断两篇文章的相似度

判断相似度基于jieba 关键字提取的方法textrank·关键字的提取代码：tf-idf·关键字的提取代码：统计数据统计数据的代码：完整代码：基于jieba 关键字提取的方法textrank1，将待抽取关键词的文本进行分词2，以固定窗口大小(默认为5，通过span属性调整)，词之间的共现关系，构建图3，计算图中节点的PageRank，注意是无向带权图·关键字的提取代码：#textrankdef testRank(corpus1, corpus2): keywords_textran

2021-11-21 20:22:14 1861

原创 DBSCAN聚类算法原理以及代码

算法介绍简单理解算法优点代码简单理解算法里面有两个参数，一个是半径，另一个是数量，根据半径划分范围，在这个范围内的数据可以称为直接密度可达，然后取在这个范围内的每个数据根据半径再继续划分范围，从而达到“传播”的效果算法优点不需要事先知道要形成的簇类的数量。可以发现任意形状的簇类。对噪声敏感，更容易找到噪声代码# 导入包from sklearn.cluster import KMeans # 算法from sklearn.datasets import load_iris #

2021-11-18 19:49:29 2493 1

原创 Kmeans算法提升

深入理解算法K均值调包可视化展示选取最优K值手肘法轮廓系数K均值调包# 导入包from sklearn.cluster import KMeans # 算法from sklearn.datasets import load_iris # 数据集from sklearn.model_selection import train_test_split # 数据集划分from sklearn.metrics import accuracy_score #评估from skl

2021-11-18 19:46:32 1649

原创 Kmeans算法提升

深入理解算法K均值调包可视化展示：选取最优K值手肘法轮廓系数K均值调包# 导入包from sklearn.cluster import KMeans # 算法from sklearn.datasets import load_iris # 数据集from sklearn.model_selection import train_test_split # 数据集划分from sklearn.metrics import accuracy_score #评估from sk

2021-11-18 19:35:21 2051

原创爬虫实现百度贴吧的图片爬取

爬取图片基本流程：代码如下：基本流程：初始化要爬取的内容，然后使用requests模块进行爬取，使用xpath进行匹配，最后再将图片和详情存入文件夹里面代码如下：import requestsimport reimport timeimport randomimport lxml.etreefrom lxml.html import tostringfrom lxml import etree"""初始化参数"""kw = '篮球'base_url = 'http://tieba

2021-11-18 18:55:34 1670 1

原创 CSDN写文章怎么缩进？

每次我们写文章时，都找不到缩进的按钮，在这里进行总结一下缩进的方式&emsp;能缩进一个汉字，可叠加&ensp;能缩进半个汉字，可叠加 能缩进四分之一，可叠加一般需要所缩进两个汉字，以下方式都可以缩进两个汉字&emsp;&emsp;&ensp;&ensp;&ensp;&ensp;      &nb

2021-11-13 11:27:52 2259 1

原创爬虫+基本的天气对话机器人

查询天气的对话机器人基本思路关于数据的爬取基础知识爬取的过程分析数据可视化数据的保存声音处理录音及其转文字关于语音播报代码基本思路使用selenium模块来进行谷歌驱动，爬取相关的数据，然后将数据进行处理，利用正则分离数据，然后就是把每个功能包装成一个函数，利用得到的数据，实现存入数据库，以及存入csv等相关功能，还有一个就是数据可视化，先后荣立使用的是matplotlib和Pyecharts两个库，相对于matplotlib而言，Pyecharts做出的数据可视化更加的真实，可以动态交互的展现图表

2021-11-13 11:16:22 4375 1

空空如也

空空如也