自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 NLP应用2——中文文本分类三(使用TextCNN)

使用TextCNN进行中文文本分类1 定义网络结构2 读取数据及数据处理2.1 定义一些数据处理的函数2.2 数据处理与训练1 定义网络结构根据论文Convolutional Neural Networks for Sentence Classification中给出的TextCNN模型基本结构来构建模型。TextCNN模型基本结构示意图:from tensorflow.keras import Input, Modelfrom tensorflow.keras.layers import Em

2021-04-08 18:21:22 2574

原创 NLP应用2——中文文本分类二(使用fasttext)

使用fasttext进行中文文本分类1 读取数据2 将数据处理成fasttext可以处理的格式3 调用fastText训练生成模型4 对模型效果进行评估在前面的文章中使用了sklearn库中的词袋模型+SVM进行文本分类的建模,下面使用facebook开源的一个词向量与文本分类工具——fasttext对文本进行分类建模。fasttext具有型简单,训练速度快的优点。通过阅读官方文档,我们知道使用fasttext进行文本分类时,要求文本文件的每一行都包含一个标签列表,后面是对应的文档。所有的标签都以

2021-04-07 16:29:22 855 2

原创 NLP应用2——中文文本分类

中文文本分类1 项目简介1 项目简介在各种资讯类网页、APP中都能看见各种标签,实际就是对不同文章的内容进行分类。通过构建模型,对不同领域内的文本进行分类。用作模型训练的数据集包含科技、汽车、娱乐、军事、运动共计5类文本数据。...

2021-04-06 18:31:48 326

原创 NLP应用1——简易语种识别器

项目背景 在搜索引擎公司,会拿到一些用户检索请求,这些检索内容短文本往往包含了用户的意图,用户意图的识别本质其实就是文本分类问题;在一些资讯类APP中,核心内容往往是以文本的形式呈现的,为了完成内容的推送,需要进行文本分类在这里插入代码片...

2021-03-25 12:28:00 807 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除