自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Young, Simple, Naive

昼引老妻乘小艇,晴看稚子浴清江。

  • 博客(98)
  • 资源 (1)
  • 收藏
  • 关注

原创 NLP论文共读计划

NLP 之路

2021-07-15 11:07:39 711 3

原创 Training language models to follow instructions with human feedback

InstructGPT: SFT + RLHF with PPO(目标函数:RM - KL+PTX objective)

2024-04-02 16:21:53 266

原创 Finetuned Language Models Are Zero-Shot Learners

指令微调模型 FLAN 显著提升 zero-shot 能力

2024-03-30 16:36:47 432

原创 LaMDA: Language Models for Dialog Applications

通过标注数据微调和工具调用来提升对话模型的 safety 和 groundedness

2024-03-27 11:00:06 242

原创 Learning to summarize from human feedback

使用强化学习微调总结生成模型

2024-03-19 17:32:12 241

原创 西安雁塔未来人工智能计算中心算力成本分析

西安雁塔未来人工智能计算中心的算力大概花了多少钱

2024-03-05 22:19:54 478

原创 Fine-Tuning Language Models from Human Preferences

在人类偏好上训练奖励模型,然后使用强化学习微调预训练语言模型

2023-12-30 12:57:21 1185

原创 西瓜书公式(10.31)的推导

与 Isomap 试图保持近邻样本之间的距离不同,局部线性嵌入(Locally Linear Embedding, 简称 LLE)试图保持邻域内样本之间的线性关系。西瓜书 10.5.2 节 局部线性嵌入。表示要求特征向量是单位向量)。则式 (10.29) 可重写为。LLE 在低维空间(维度为。进行特征值分解后最小的。个特征值对应的特征向量(LLE 先为每个样本。

2023-07-22 19:50:53 158

原创 Learning from Dialogue after Deployment: Feed Yourself, Chatbot!

让机器人在对话中学习

2023-06-17 23:09:09 422

原创 k8s集群证书管理

Kubenetes 证书管理的一些记录

2023-06-10 17:12:22 1350 1

原创 西瓜书公式(10.24)的推导

在西瓜书 10.4 节 “核化线性降维” 中,引入了一个映射函数。是高维空间中的一个标准正交基。映射到高维特征空间中,即。的具体形式,于是引入核函数。由前文中的推导可以得到。一般情形下,我们不清楚。

2023-06-10 13:31:05 1136

原创 Dialogue Transformers

Rasa 中的 Transformer Embedding Dialogue (TED) 对话策略

2023-02-11 21:03:49 525 1

原创 CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling

通过 MH 采样实现带约束的句子生成

2022-11-26 15:44:05 857

原创 PADA: Example-based Prompt Learning for on-the-fly Adaptation to Unseen Domains

Source Domain -> DRF -> Example-specific Prompt -> Unseen Domain

2022-10-22 20:48:13 485

原创 Jax 中的 Autograd 和 PyTorch 中的 Autograd 有何联系?

其实都有 HIPS/autograd 血统

2022-09-28 07:33:48 453

原创 SimCSE: Simple Contrastive Learning of Sentence Embeddings

仅使用标准的 dropout 作为噪声

2022-08-06 19:57:30 347

原创 CLEAR: Contrastive Learning for Sentence Representation

数据增强+对比学习+MLM

2022-06-25 19:08:02 588

原创 DeCLUTR: Deep Contrastive Learning for Unsupervised Textual Representations

使用自监督对比学习来学习文本表示

2022-06-18 15:34:36 246

原创 An Unsupervised Sentence Embedding Method by Mutual Information Maximization

IS-BERT: 基于句子表示与局部 n-gram 表示互信息最大化来进行无监督句子表示学习

2022-05-28 20:46:09 242

原创 Sentence Meta-Embeddings for Unsupervised Semantic Textual Similarity

将预训练 sentence encoders 集成到 sentence meta-embeddings 中,解决无监督 STS 任务。

2022-05-28 14:49:08 111

原创 Multi-View Domain Adapted Sentence Embeddings for Low-Resource Unsupervised Duplicate Question Detec

MV-DASE 基于 GCCA 合并了多种不同的 embedding

2022-04-10 17:40:26 853

原创 Domain Adaptive Dialog Generation via Meta Learning

DAML

2022-04-09 10:25:33 199

原创 Overview of the English Slot Filling Track at the TAC2014 Knowledge Base Population Evaluation

Abstract概述了 TAC2014 Knowledge Base Population (KBP) evaluation 中的的词槽填充赛道 (English Slot Filling (SF) track)。KBP 旨在促进从自由文本中提取命名实体和数值型实体之间的二元关系的研究。今年(2014)的主要变化是:包含歧义查询接受通过推断得到的输出对任务和输入格式的简化,移除了 query 中实体对于知识库的引用最高得分为 36.72 F1,中位数为 19.80 F1。1 Introd

2022-03-19 19:02:36 211

原创 Generating Datasets with Pretrained Language Models

使用大型预训练语言模型生成语义文本相似度数据集

2022-03-14 21:37:51 365

原创 Unsupervised Data Augmentation for Consistency Training

有限的标注数据也能带来很好的性能

2022-03-12 17:36:07 4491

原创 Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Process

prompt-based learning 综述

2022-03-05 22:36:49 245

原创 Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference

Pattern-Exploiting Training (PET):定义 (pattern, verbalizer) -> fine-tune 模型 -> 自动标注 -> 训练分类器

2022-02-24 07:30:18 285

原创 Language Models as Knowledge Bases?

LAMA is a probe to test the factual and commonsense knowledge in language models.

2022-01-28 21:23:33 1000

原创 Parameter-Efficient Transfer Learning for NLP

对于 N 个下游任务,fine-tuning 需要 N 倍预训练模型的参数量,而 Adapter 可以只用接近 1 倍的参数量实现类似的性能。

2022-01-22 21:06:08 2215

原创 Effective Approaches to Attention-based Neural Machine Translation

global attention & local attention

2022-01-15 12:24:32 320

原创 Synthetic QA Corpora Generation with Roundtrip Consistency

答案抽取 + 问题生成 + roundtrip consistency

2022-01-11 19:39:27 449

原创 Learning to Ask: Neural Question Generation for Reading Comprehension

基于 attention 和 seq2seq 的问题生成

2022-01-08 20:54:13 541

原创 Latent Retrieval for Weakly Supervised Open Domain Question Answering

第一个 retriever 和 reader 端到端联合学习的开放领域问答系统

2022-01-03 18:55:53 634

原创 DeepRank: A New Deep Architecture for Relevance Ranking in Information Retrieval

基于深度学习的 IR 排序模型

2022-01-02 19:46:32 395

原创 From RankNet to LambdaRank to LambdaMART: An Overview

LambdaMART 是 LambdaRank 的提升树版本

2022-01-01 19:29:30 447

原创 Learning to Rank with Nonsmooth Cost Functions

在 RankNet 的基础上改进而来

2021-12-22 21:45:29 724

原创 Learning to Rank using Gradient Descent

神经网络排序模型

2021-12-05 21:28:11 1226

原创 The Second Conversational Intelligence Challenge (ConvAI2)

开发领域对话比赛

2021-11-27 20:54:26 785

原创 ELMo: Deep contextualized word representations

基于双向语言模型的词表示

2021-11-20 22:49:18 518

原创 Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

一种迁移学习的统一框架

2021-11-14 20:22:15 601

语音和语言处理英文版第3版带书签

Speech and Language Processing-Third Edition 作者: Daniel Jurafsky / James H. Martin 副标题: an Introducation to Natural Language Processing, Computational Linguistics, and Speech Recognition

2018-12-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除