Flame5376-CSDN博客

原创 Effective Neural Topic Modeling with Embedding Clustering Regularization

问题：topic models 会面临主题崩塌（主题在语义上崩塌在一块）的问题，导致主题重复度高，主题发现不充分，影响模型的可解释性。模型：提出了一个ECRTM，Embedding Clustering Regularization Topic Model。在保留重构误差的基础上，提出了ECR，Embedding Clustering Regularization，让每个topic作为聚类的簇，缓解了主题崩塌。

2024-08-28 06:01:06 933

原创 AASAE：通过数据增强替换KL

通过数据增强替换KL正则化。

2024-06-25 22:54:55 547

原创《Self-supervised clustering with assistance from off-the-shelf classifier》学习

大多数聚类分布高度依赖设定的非线性映射得到的中间目标分布聚类结果很容易收到每个簇中错误分配的样本的影响，导致错误。现有的深度聚类方法无法区分这些样本。提出了一个 “self-supervised clustering framework, which boosts the clustering performance byin anmanner”用到了模糊理论来给训练时期的每个样本属于簇的概率评分。根据隶属度选择方法选择最可靠的样本，并进行数据增强。增强后的数据通过自监督。

2024-06-05 16:39:33 616

原创《A Decoder-Free Variational Deep Embedding for Unsupervised Clustering》学习

对于聚类任务，模型训练后decoder是无用的，encoder-decoder的结构限制了encoder的深度，降低了模型的学习能力。

2024-04-02 09:16:48 1561 1

原创《Variational Graph Auto-Encoders》学习

现看看VGAE运行原理，再对比和GAE的区别，思考对于下一个模型的启发。

2024-03-25 14:10:56 246 1

原创《Deep Fusion Clustering Network》启发

将AE和图神经网络结合起来，利用结构信息提高性能。

2024-03-22 20:51:18 1127 1

原创《Contrastive deep embedded clustering》学习

利用深度自动编码器来学习潜在的具有区分性嵌入式聚类结构，并通过构建正样本和负样本来克服缺少标签信息的问题。

2023-10-11 21:47:28 85

原创《Supporting Clustering with Contrastive Learning》学习

论文名：Supporting Clustering with Contrastive Learning。Loss:对比loss+聚类loss。论文来源：NAACL 2021。

2023-10-11 16:50:56 86

原创 VAE代码（失败记录）

跑了一天，出来的值一直很怪。

2023-09-14 15:27:04 165 1

原创 VAE生成模型学习

输出为码m(均值)+方差σ(取exp为标准差,为正数)，构成一个分布，从标准差中采样一个值(e,相当于噪声)，生成一个新的带噪声的码ccmexpσ∗eloss约束：除了重构损失外，还需要满足expσi−1σi图像如下方绿色曲线，使其最小化，即σi趋近于0。

2023-09-07 19:00:19 119 1

原创文本向量化

词语序列中出现的词语其数值为词语在所在文本中的。

2023-09-06 08:24:48 40 1

原创 LDA生成模型学习

文档m产生主题θ的概率，主题θ产生单词w的概率都不再是某两个确定的值，而是。，是从dirichlet先验中“随机”抽取出主题分布。除了生成的单词W，其他都是隐变量或参数。

2023-09-05 21:30:21 98 1

原创贝叶斯定理(更新中)

新证据不能直接凭空的决定你的看法，而是应该更新你的先验看法”

2023-08-29 21:46:43 81 1

原创《基于增强语义的深度文本聚类方法研究》学习(更新中)

对于文本聚类任务，可以将每个词作为一个特征，并根据训练数据集中不同词出现的频次或者权重来估计各个类别下某个词出现的条件概率。在构建过程中, 贝叶斯网络使用有向无环图(DAG)表示随机变量之间依赖关系, 并使用参数化形式定义了联合分布. 在具体实践时, 变量节点通常表示文本特征, 而类别节点则表示聚类结果。贝叶斯模型是一种基于贝叶斯定理的概率统计模型，用于描述和推断随机事件之间的关系。通过计算后验分布，我们可以根据已有信息来更新和调整我们对未知参数或变量的信念，并进行推断、预测等任务。较大而无法清晰分离。

2023-08-29 21:45:48 166 1

m0_46114999的博客