chansonzhang-CSDN博客

与 Isomap 试图保持近邻样本之间的距离不同，局部线性嵌入（Locally Linear Embedding, 简称 LLE）试图保持邻域内样本之间的线性关系。西瓜书 10.5.2 节局部线性嵌入。表示要求特征向量是单位向量）。则式 (10.29) 可重写为。LLE 在低维空间（维度为。进行特征值分解后最小的。个特征值对应的特征向量（LLE 先为每个样本。

2023-07-22 19:50:53 158

原创 Learning from Dialogue after Deployment: Feed Yourself, Chatbot!

让机器人在对话中学习

2023-06-17 23:09:09 422

原创 k8s集群证书管理

Kubenetes 证书管理的一些记录

2023-06-10 17:12:22 1350 1

原创西瓜书公式（10.24）的推导

在西瓜书 10.4 节 “核化线性降维” 中，引入了一个映射函数。是高维空间中的一个标准正交基。映射到高维特征空间中，即。的具体形式，于是引入核函数。由前文中的推导可以得到。一般情形下，我们不清楚。

2023-06-10 13:31:05 1136

原创 Dialogue Transformers

Rasa 中的 Transformer Embedding Dialogue (TED) 对话策略

2023-02-11 21:03:49 525 1

原创 CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling

通过 MH 采样实现带约束的句子生成

2022-11-26 15:44:05 857

原创 PADA: Example-based Prompt Learning for on-the-fly Adaptation to Unseen Domains

Source Domain -> DRF -> Example-specific Prompt -> Unseen Domain

2022-10-22 20:48:13 485

原创 Jax 中的 Autograd 和 PyTorch 中的 Autograd 有何联系？

其实都有 HIPS/autograd 血统

2022-09-28 07:33:48 453

原创 SimCSE: Simple Contrastive Learning of Sentence Embeddings

仅使用标准的 dropout 作为噪声

2022-08-06 19:57:30 347

原创 CLEAR: Contrastive Learning for Sentence Representation

数据增强+对比学习+MLM

2022-06-25 19:08:02 588

原创 DeCLUTR: Deep Contrastive Learning for Unsupervised Textual Representations

使用自监督对比学习来学习文本表示

2022-06-18 15:34:36 246

原创 An Unsupervised Sentence Embedding Method by Mutual Information Maximization

IS-BERT: 基于句子表示与局部 n-gram 表示互信息最大化来进行无监督句子表示学习

2022-05-28 20:46:09 242

原创 Sentence Meta-Embeddings for Unsupervised Semantic Textual Similarity

将预训练 sentence encoders 集成到 sentence meta-embeddings 中，解决无监督 STS 任务。

2022-05-28 14:49:08 111

原创 Multi-View Domain Adapted Sentence Embeddings for Low-Resource Unsupervised Duplicate Question Detec

MV-DASE 基于 GCCA 合并了多种不同的 embedding

2022-04-10 17:40:26 853

原创 Domain Adaptive Dialog Generation via Meta Learning

DAML

2022-04-09 10:25:33 199

原创 Overview of the English Slot Filling Track at the TAC2014 Knowledge Base Population Evaluation

Abstract概述了 TAC2014 Knowledge Base Population (KBP) evaluation 中的的词槽填充赛道（English Slot Filling (SF) track）。KBP 旨在促进从自由文本中提取命名实体和数值型实体之间的二元关系的研究。今年（2014）的主要变化是：包含歧义查询接受通过推断得到的输出对任务和输入格式的简化，移除了 query 中实体对于知识库的引用最高得分为 36.72 F1，中位数为 19.80 F1。1 Introd

2022-03-19 19:02:36 211