自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

CandyLa*

小白敲代码、学习使我快乐

  • 博客(6)
  • 收藏
  • 关注

原创 jieba分词+删除停用词

使用jieba对中文文本进行简单的分词并存储操作,详细的分词操作请见:jieba分词的

2022-06-03 19:28:43 5044 1

原创 nn.Module模块概述

nn.Module模块概述nn.Modulereference:nn.Module在定义自已的网络的时候,需要继承nn.Module类,并重新实现构造函数__init__()和forward这两个方法。在构造函数__init__()中使用super(Model, self).init()来调用父类的构造函数,forward方法是必须要重写的,它是实现模型的功能,实现各个层之间的连接关系的核心。1.一般把网络中具有可学习参数的层(如全连接层、卷积层)放在构造函数__init__()中。2.一般把不具

2021-04-16 11:47:21 1155

原创 textCNN

视频链接:https://www.bilibili.com/video/BV1ip4y1U735/二、非定长句子分类2.1 模型图

2021-04-14 17:55:06 225

原创 torchtext学习笔记

torchtext学习笔记Torchtext主要内容1.Field2.Dataset(自定义类)3.Iterator提示:以下是本篇文章正文内容,下面案例可供参考Torchtext主要内容torchtext对文本数据的预处理主要包含Field、Dataset、Iterator这三个部分。1.Field用来定义字段处理的方法(如文本、标签字段),是否区分大小写,指定分词方法。[常用的参数]squential:数据是否为序列数据,Default: Ture;若为False,则不能使用分词。lo

2021-04-14 16:07:19 2415 4

原创 Word2Vec学习笔记

Word2Vec是词嵌入的一种,简单来说就是将词转化为词向量word2vec工具可以分为两种:CBOW和Skip-gram

2021-04-12 21:27:25 114

原创 NNLM神经网络语言模型学习笔记

NNLM(神经网络语言模型)简介一、模型的网络结构二、模型的原理2.1 模型的输入2.2 模型的输出三、模型的实践3.1 目标、参数和计算流程3.2 代码实现3.2.1 数据处理3.2.2 获取输入与目标数据3.2.3 模型的定义3.2.3 分类训练3.2.3 测试总结简介NNLM是从语言模型出发(即计算概率角度),构建神经网络针对目标函数对模型进行最优化,训练的起点是使用神经网络去搭建语言模型实现词的预测任务,并且在优化过程后模型的副产品就是词向量。词向量对后面深度学习在自然语言处理方面有很大的.

2021-04-12 17:14:16 399

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除