自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 word2vec结合TF_IDF进行多标签文本分类(三)

本文是在Word2vec的基础上结合TF_IDF对中文文本分类的方式。数据格式见此链接关于TF_IDF的理论可自行搜索具体方式参考下图:模型构建:迭代结果:结果可视化:

2022-07-13 11:47:20 1176 3

原创 采用Bi-LSTM结合Word2vec进行中文文本多标签分类

关于word2vec的详细介绍可以参考此篇文章实现方式采用了gensim工具,并根据结果进行文本向量化。本篇文章采用的数据集和上篇文章采用的一样和上篇文章不同的是加入了注意力机制层和进行词嵌入的时候对权重进行了赋值,关于keras中Embedding层的介绍可以参考这篇文章并引入了Bi-LSTM构建的模型:运行结果:结果可视化:...

2022-07-12 19:40:28 1141 4

原创 基于keras采用LSTM实现多标签文本分类(一)

1.多标签即一条语句可能有多个类别划分。例如,这个酸菜鱼又酸又辣。属于酸和辣两个标签。在采用神经网络学习时,最后一层的激活函数应采用sigmoid激活函数,相当于对这条语句做了多个二分类。2.多分类即每条语句只有一个标签,在采用神经网络学习时,最后一层的激活函数应采用softmax激活函数,最后选取类别中的最大值作为预测结果。关于sigmoid和softmax 的区别此处再说明。本次数据集的格式为:关于LSTM的学习可以参考这篇。关于词向量化的方式,本文采用keras 内置Tokenizer A

2022-07-08 21:25:17 2799 1

原创 Java 实现线段树的两种方式

线段树就是采用树形结构维护数组区间,使得查询的时间复杂度由O(n)下降到O(log n)方式一数组实现:方式二 建树实现:

2022-07-06 22:18:21 377

原创 中文文本多标签文本分类(python tensorflow2实现 )

中文文本多标签文本分类 (python实现)

2022-06-28 16:57:27 2101 2

原创 【Java实现红黑树的插入操作】

该文章的内容主要是红黑树的插入和删除操作。

2022-06-27 20:39:32 300

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除