nlp
文章平均质量分 95
ZNineSun
大道至简,返璞归真
展开
-
《nlp入门+实战:第九章:循环神经网络》
tokenization就是通常所说的分词,分出的每一个词语我们把它称为token。jieba分词: https://github.com/fxsjy/jieba清华大学的分词工具THULAC: https://github.com/thunlp/THULAC-Python。原创 2022-08-05 22:52:55 · 382 阅读 · 0 评论 -
《nlp入门+实战:第八章:使用Pytorch实现手写数字识别》
黑白图片的通道数只有1,其中每个像素点的取值为[0,255],彩色图片的通道数为(R,G.B),每个通道的每个像素点的取值为[0,255],三个通道的颜色相互叠加。同理230->220也是如此,他在第二个维度里面,所以用230减去(10,10,10)中的第二个10,除以方差中(1,1,1)中的第一个1,即(230-10)/1=220。给定均值: mean,shape和图片的通道数相同(指的是每个通道的均值),方差: std,和图片的通道数相同(指的是每个通道的方差),将会把Tensor规范化处理。.....原创 2022-08-03 15:11:42 · 485 阅读 · 1 评论 -
《nlp入门+实战:第七章:pytorch中数据集加载和自带数据集的使用》
在torch中提供了数据集的基类,继承这个基类,我们能够非常快速的实现对数据的加载。torch.utils.data.Dataset的源码如下1._len_方法,能够实现通过全局的len()方法获取其中的元素个数2._getitem_方法,能够通过传入索引的方式获取数据,例如通过dataset[i]获取其中的第i条数据数据集的原始地址http运行以后,会在data目录下生成以下数据集可以看出其中数据集返回了两条数据,可以猜测为图片的数据和目标值由上可知httpshttps。...............原创 2022-07-29 19:40:24 · 1104 阅读 · 0 评论 -
《nlp入门+实战:第六章:常见优化器算法的介绍》
每次迭代都需要把所有样本都送入,这样的好处是每次迭代都顾及了全部的样本,做的是全局最优化。针对梯度下降算法训练速度过慢的缺点,提出了随机梯度下降算法,随机梯度下降算法算法是从样本中随机抽出一组,训练后按梯度更新一次,然后再抽取一组,再更新一次,在样本量及其大的情况下,可能不用训练完所有的样本就可以获得一个损失值在可接受范围之内的模型了。SGD相对来说要快很多,但是也有存在问题,由于单个样本的训练可能会带来很多噪声,使得SGD并不是每次迭代都向着整体最优化方向,因此在刚开始训练时可能收敛得很快,但是训练一段时原创 2022-07-28 23:44:01 · 439 阅读 · 0 评论 -
《nlp入门+实战:第五章:使用pytorch中的API实现线性回归》
nn.Modul是torch.nn提供的一个类,是pytorch中我们自定义网络的一个基类,在这个类中定了很多有用的方法,让我们在继承这个类定义网络的时候非常简单。我们自己实现了通过torch的相关方法完成反向传播和参数更新,在pytorch中预设—些更加灵活简单的对象,让我们来构造模型、定义损失,优化损失等。但是在其他的一些模型中,训练的参数和预测的参数会不相同,到时候就需要具体告诉程序我们在进行训练还是预测,比如模型中存在。那么接下来,我们一起来了解一下其中常用的API。.........原创 2022-07-28 17:28:25 · 364 阅读 · 0 评论 -
《nlp入门+实战:第四章:使用pytorch手动实现线性回归 》
loss.backward()就是根据损失函数,对参数(requires_grad=True)的去计算他的梯度,并且把它。原创 2022-07-25 23:44:15 · 358 阅读 · 0 评论 -
《nlp入门+实战:第三章:梯度下降和反向传播 》
梯度:是一个向量,导数+变化最快的方向(学习参数的前进方向)回顾机器学习收集数据x。构建机器学习模型f,得到原创 2022-07-25 16:45:38 · 687 阅读 · 0 评论 -
《nlp入门+实战:第二章:pytorch的入门使用 》
Pytorch是一款facebook发布的深度学习框架,由其易用性,友好性。深受广大用户青睐。原创 2022-07-23 23:26:36 · 1126 阅读 · 0 评论 -
《nlp入门+实战:第一章:深度学习和神经网络》
人工神经网络(英语ArtificialNeuralNetwork,ANN),简称神经网络(NeuralNetwork,NN)或类神经网络,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型,用于对函数进行估计或近似。和其他机器学习方法一样,神经网络已经被用于解决各种各样的问题,例如机器视觉和语音识别,这些问题都是很难被传统基于规则的编程所解决的。......原创 2022-07-22 18:05:08 · 570 阅读 · 0 评论