自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

小欧欧的博客

你好，智能！

NLP

关注

文章平均质量分 65

关注数：文章数：1 文章阅读量：3557 文章收藏量：32

作者: Jie Ou

学习

展开

专栏收录文章

【NLP入门-中文文本分类】步骤详解，附keras代码

一、NLP 文本分类步骤第一步：准备数据集，X：句子；Y：类别第二步：分词，并去除停词（中文理由停词，比如而且，逗号之类；英文的话需要做词的时态转换之类）第三步：word2idx/word2vec；这里word2vec，可以利用语料库，训练一个单词转为向量的model，这个模型你输入单词，会给你一个向量，并且能计算单词的相似度，相当于提前给词语做了归一化；word2idx就直接用词汇表的id作为向量的元素；第四步：建模训练二、代码1、数据准备➕预处理我们采用，头条新闻数据集

原创 2022-02-28 22:58:29 · 3558 阅读 · 0 评论