自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 推荐系统-冷启动-自用

DropoutNet借鉴了降噪自动编码机(denoising autoencoder)的思想,即训练模型接受被corrupted的输入来重建原始的输入,也就是学习一个模型使其能够在部分输入特征缺失的情况下仍然能够得到比较精确的向量表示,具体地,模型是要使得在输入被corrupted的情况下学习到的用户向量与物品向量的相关性分尽可能接近输入在没有被corrupted的情况下学习到的用户向量与物品向量的相关性分。U和V分别是外部输入的、作为监督信号的用户和物品向量表示,一般是通过其他模型学习得到。

2024-07-06 22:54:42 1152

原创 复述生成任务分类-笔记-Task-Oriented Paraphrase Analytics

以下文本对代表了由STRAP风格转换系统生成的将推文风格转换为莎士比亚风格的原始文本。

2024-07-03 12:34:20 652

原创 安装-GCPG: A General Framework for Controllable Paraphrase Generation

激活环境 source activate xxx。运行.sh文件时候,sh test.sh。

2024-07-02 12:51:14 279

原创 笔记-GCPG: A General Framework for Controllable Paraphrase Generation

GCPGGeneral Controllable Paraphrase Generation (通用可控复述生成)CPGControllable Paraphrase Generation (可控复述生成)Part-Of-Speech Sequence(词性序列)指的是一个句子中所有单词的词性标签按顺序排列形成的序列。fox (Noun)总的来说GCPC框架就是将词汇条件和句法条件结合起来,然后重新训练的一个方向。

2024-06-15 17:30:44 839

原创 笔记-Paraphrase Generation A Survey of the State of the Art

首先,计算每个时间步中源序列中每个标记的权重,以指示其重要性,强调输入中的重要信息,不强调不重要信息。多个组合力度级别结合也会很好,当同时学习在单词级、短语级和句子级生成释义时,他们的模型在多个指标上比他们的主干。由生成器和鉴别器组成,对于复述生成任务,设计了不同的判别器来区分生成的样本和真实样本、释义和非释义。一种可能的方法是利用自动评估度量中的释义识别来明确地提供生成的句子和输入的句子是否为释义的评估。即给句子产生多个不同的释义,有些人使用不同的潜在模式作为控制信号来生成不同的释义。

2024-06-03 10:47:01 435

原创 NLP-Begin-概念性知识(自用-速成版)

1.NP:名词 VP:动词 PP:介词短语 AP:形容词短语(短语级别)N:名词 V:动词 P:介词 A:形容词实际存储过程 (S(NP(N Boeing))(VP(V is)(VP(V located)(PP(P in)(NP(N Seattle))))))

2024-05-31 00:34:15 582

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除