- 博客(4)
- 收藏
- 关注
原创 NLP应用2——中文文本分类三(使用TextCNN)
使用TextCNN进行中文文本分类1 定义网络结构2 读取数据及数据处理2.1 定义一些数据处理的函数2.2 数据处理与训练1 定义网络结构根据论文Convolutional Neural Networks for Sentence Classification中给出的TextCNN模型基本结构来构建模型。TextCNN模型基本结构示意图:from tensorflow.keras import Input, Modelfrom tensorflow.keras.layers import Em
2021-04-08 18:21:22 2694
原创 NLP应用2——中文文本分类二(使用fasttext)
使用fasttext进行中文文本分类1 读取数据2 将数据处理成fasttext可以处理的格式3 调用fastText训练生成模型4 对模型效果进行评估在前面的文章中使用了sklearn库中的词袋模型+SVM进行文本分类的建模,下面使用facebook开源的一个词向量与文本分类工具——fasttext对文本进行分类建模。fasttext具有型简单,训练速度快的优点。通过阅读官方文档,我们知道使用fasttext进行文本分类时,要求文本文件的每一行都包含一个标签列表,后面是对应的文档。所有的标签都以
2021-04-07 16:29:22 966 2
原创 NLP应用2——中文文本分类
中文文本分类1 项目简介1 项目简介在各种资讯类网页、APP中都能看见各种标签,实际就是对不同文章的内容进行分类。通过构建模型,对不同领域内的文本进行分类。用作模型训练的数据集包含科技、汽车、娱乐、军事、运动共计5类文本数据。...
2021-04-06 18:31:48 465
原创 NLP应用1——简易语种识别器
项目背景 在搜索引擎公司,会拿到一些用户检索请求,这些检索内容短文本往往包含了用户的意图,用户意图的识别本质其实就是文本分类问题;在一些资讯类APP中,核心内容往往是以文本的形式呈现的,为了完成内容的推送,需要进行文本分类在这里插入代码片...
2021-03-25 12:28:00 1067 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人