【Reading List】【20190510】预训练（pre-trained）语言模型

最新推荐文章于 2024-08-08 07:48:30 发布

old_杨

最新推荐文章于 2024-08-08 07:48:30 发布

阅读量848

点赞数

分类专栏： Reading List

本文链接：https://blog.csdn.net/oldyang95/article/details/90079976

版权

Reading List 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

RNN，seq2seq，Attention：

https://www.leiphone.com/news/201709/8tDpwklrKubaecTa.html

图解transformer ：

https://blog.csdn.net/qq_41664845/article/details/84969266

Attentinon：

https://blog.csdn.net/malefactor/article/details/50550211

ELMO、GPT、BERT对比：

https://www.cnblogs.com/robert-dlut/p/9824346.html

GPT

官网：https://openai.com/blog/language-unsupervised/

解析：https://blog.csdn.net/Magical_Bubble/article/details/89497002

GPT2

官网：https://openai.com/blog/better-language-models/#update

解析：https://blog.csdn.net/Magical_Bubble/article/details/89499275

官方资源：https://github.com/openai/gpt-2

https://github.com/openai/gpt-2-output-dataset

git：https://github.com/oldyang95/GPT2-Models/

Tensorflow_GPU与Cuda对应关系：

https://blog.csdn.net/u011748542/article/details/85090268

论文：

(GPT)Improving Language Understanding by Generative Pre-Training

(GPT-2)Language Models are Unsupervised Multitask Learners

Attention Is All You Need

分享：Deep Graph Convolutional Encoders for Structured Data to Text Generation

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

old_杨

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

预训练语言模型(Pretrained Language Model)

AI天才研究院

07-12

231

预训练语言模型(Pretrained Language Model) Pretrained Language Models. 预训练语言模型(Pretrained Language

AI：159-大模型的学习路线图推荐—多维度深度分析

一键难忘的博客

01-22

3070

大模型的初心是让训练出来的模型具备不同领域的认知力，既能有泛化的能力，又能有自我进化的能力。未来，大模型将致力于构建通用的人工智能算法底层架构，将模型的认知力从单领域泛化到多领域融合，在不同场景中自我生长，向可持续、可进化的方向发展。尽管大模型在很多任务上已经取得了显著的成果，但仍存在一些局限性，如数据集的规模和质量、模型的泛化能力、训练的效率和稳定性等。● 模型可解释性的提高：目前的大型模型往往难以解释，未来随着技术的不断发展，大型模型的解释性将会得到提高，人们将能够更好地理解模型的工作原理和决策依据。

参与评论您还未登录，请先登录后发表或查看评论

NLP pretrained model

Sundrops的专栏

10-27

881

最近在公司听了NLP pretrained model的报告，感觉受益匪浅，特此分享。此处大量参考从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史 Word Embedding 词向量在自然语言处理中有着重要的角色，它将抽象的词语之间的语义关系量化成向量形式。有了良好的词向量，我们就可以做更多的工作。目前构建词向量的方式大体上分成两大类：统计方法：通过统计词语...

推荐文章：FinBERT —— 深度解读金融文本情感的利器

最新发布

gitblog_00200的博客

08-08

747

自然语言处理中的PretrainedLanguageModel

AI天才研究院

01-21

821

1.背景介绍自然语言处理(NLP)是计算机科学和人工智能领域的一个重要分支，旨在让计算机理解、生成和处理人类自然语言。在过去的几年里，预训练语言模型(Pre-trained Language Model，简称PLM)在NLP领域取得了显著的进展。这篇文章将深入探讨PLM在NLP中的应用和特点，并分享一些最佳实践和实际案例。 1. 背景介绍自然语言处理是一种通过计算机程序处理和理解人类自然...

Pretrained_model.rar

06-02

InceptionV3和xception，预训练模型，适合Keras库，包括有notop的和无notop的。CSDN上传最大只能480M，后续的模型将陆续上传，GitHub限速，搬的好累，搬了好几天。放到CSDN上，方便大家快速下载。

Enriching Pre-trained Language Model with Entity Information for Relation Classification论文阅读

qq_38404514的博客

04-21

525

论文题目：Enriching Pre-trained Language Model with Entity Information for Relation Classification 作者：Shanchan Wu，Yifan He ， Alibaba Group (U.S.) Inc., Sunnyvale, CA 原文链接：https://arxiv.org/pdf/1905.08284.p...

【搜索排序】预训练综述Pre-training Methods in Information Retrieval

weixin_40485502的博客

05-05

767

《自然语言处理-基于预训练模型的方法》笔记

github_34349558的博客

08-13

5316

《自然语言处理-基于预训练模型的方法》笔记文章目录《自然语言处理-基于预训练模型的方法》笔记@[toc]〇.写在前面一、绪论(一) NLP 任务体系I.任务层级II.任务类别III.研究层次(二) 预训练的时代二、NLP 基础(一) 文本表示I.独热向量II.分布式表示III.词嵌入表示IV.词袋表示(二) NLP 任务I.语言模型II. 基础任务III. 应用任务(三) 基本问题I. 文本分类问题II. 结构预测问题III. 序列到序列问题(四) 评价指标I. 标准答案明确的情况II. 标准答案不明确的

利用预训练语言模型拓展实体集合

乌云压顶是吧

06-15

1002

???? Reading Group 的 pdf 版本今天介绍一个小众的 Task, 实体集合拓展(Entity set expansion). Empower Entity Set Expansion via Language Model Probing. ACL 2020. Yunyi Zhang, Jiaming Shen, Jingbo Shang, Jiawei Han 任务的目标是拓展原有的实体集合，向其中添加相同类别的实体，注意这里的实体类别一般不是传统的 7 大 NER 类别，更偏向 Fi

关于大语言模型的论文和学习资源集合

05-14

205

【代码】关于大语言模型的论文和学习资源集合。

mobilenet-ssd pretrained model

05-11

Mobilenet+SSD在Jeston TX2预训练模型,这里的预训练模型是从Tensorflow那边转化过来的，然后经过了VOC数据集的初步调试。

[文献阅读]—Reusing a Pretrained Language Model on Languages with Limited Corpora for Unsupervised NMT

jokerxsy的博客

11-25

384

前言论文地址：https://aclanthology.org/2020.emnlp-main.214.pdf 代码地址：https://github.com/alexandra-chron/relm_unmt 前人工作&存在问题对于高单语资源(HMR)和低单语资源(LMR)之间的UNMT，直接在共享词表上做预训练初始化效果不好。本文贡献通过先在HMR上预训练，再在LMR+HMR上"fine-tune"的方式，完成UNMT的初始化。具体方法第一步：在HMR上预训练LM 第二步：在HMR

《Multi-task Learning based Pre-trained Language Model for Code Completion》阅读

专心致志写BUG的博客

10-26

1153

Multi-task Learning based Pre-trained Language Model for Code Completion 目录 Multi-task Learning based Pre-trained Language Model for Code Completion ABSTRACT 1 INTRODUCTION 2 BACKGROUND 2.1 Statistical Language Model 2.2 Multi-task Learning 2.3

深度学习-图像分类经典模型（pretrained model）

gisupc的专栏

04-25

7244

一、来自TensorFlow官网的下载链接 http://download.tensorflow.org/models/inception_resnet_v2_2016_08_30.tar.gz http://download.tensorflow.org/models/vgg_19_2016_08_28.tar.gz Inception V1. FROM: http://downloa...

pytorch pretrained model

swfa1的专栏

07-24

3045

pytorch pretrained model two methods method 1 比较大小 self._model = models.__dict__[args.arch](pretrained = False, num_classes = args.classes, ...

tensorflow pretrained model

swfa1的专栏

05-23

4326

tensorflow 简单的加载训练好的模型，如果某一层形状不一样就自动的省略，也可以用reshape。def optimistic_restore(session, save_file): reader = tf.train.NewCheckpointReader(save_file) saved_shapes = reader.get_variable_to_shape_map(

【预训练语言模型】WKLM: Pretrained Encyclopedia: Weakly Supervised Knowledge-Pretrained Language Model

夏栀的博客

06-26

1131

知识增强的预训练语言模型旨在借助外部知识库的结构化知识，在对语言模型进行预训练的时候显式地让模型学习到结构事实知识。本文分享一篇来自ICLR 2020的知识增强预训练的工作。

预训练语言模型入门

行步至春深

09-15

1439

笔记博客 b站刘知远团队大模型公开课全网首发 P32-35