- 博客(6)
- 收藏
- 关注
原创 推荐系统-冷启动-自用
DropoutNet借鉴了降噪自动编码机(denoising autoencoder)的思想,即训练模型接受被corrupted的输入来重建原始的输入,也就是学习一个模型使其能够在部分输入特征缺失的情况下仍然能够得到比较精确的向量表示,具体地,模型是要使得在输入被corrupted的情况下学习到的用户向量与物品向量的相关性分尽可能接近输入在没有被corrupted的情况下学习到的用户向量与物品向量的相关性分。U和V分别是外部输入的、作为监督信号的用户和物品向量表示,一般是通过其他模型学习得到。
2024-07-06 22:54:42
1152
原创 复述生成任务分类-笔记-Task-Oriented Paraphrase Analytics
以下文本对代表了由STRAP风格转换系统生成的将推文风格转换为莎士比亚风格的原始文本。
2024-07-03 12:34:20
652
原创 安装-GCPG: A General Framework for Controllable Paraphrase Generation
激活环境 source activate xxx。运行.sh文件时候,sh test.sh。
2024-07-02 12:51:14
279
原创 笔记-GCPG: A General Framework for Controllable Paraphrase Generation
GCPGGeneral Controllable Paraphrase Generation (通用可控复述生成)CPGControllable Paraphrase Generation (可控复述生成)Part-Of-Speech Sequence(词性序列)指的是一个句子中所有单词的词性标签按顺序排列形成的序列。fox (Noun)总的来说GCPC框架就是将词汇条件和句法条件结合起来,然后重新训练的一个方向。
2024-06-15 17:30:44
839
原创 笔记-Paraphrase Generation A Survey of the State of the Art
首先,计算每个时间步中源序列中每个标记的权重,以指示其重要性,强调输入中的重要信息,不强调不重要信息。多个组合力度级别结合也会很好,当同时学习在单词级、短语级和句子级生成释义时,他们的模型在多个指标上比他们的主干。由生成器和鉴别器组成,对于复述生成任务,设计了不同的判别器来区分生成的样本和真实样本、释义和非释义。一种可能的方法是利用自动评估度量中的释义识别来明确地提供生成的句子和输入的句子是否为释义的评估。即给句子产生多个不同的释义,有些人使用不同的潜在模式作为控制信号来生成不同的释义。
2024-06-03 10:47:01
435
原创 NLP-Begin-概念性知识(自用-速成版)
1.NP:名词 VP:动词 PP:介词短语 AP:形容词短语(短语级别)N:名词 V:动词 P:介词 A:形容词实际存储过程 (S(NP(N Boeing))(VP(V is)(VP(V located)(PP(P in)(NP(N Seattle))))))
2024-05-31 00:34:15
582
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人