- 博客(6)
- 收藏
- 关注
原创 PaddleNLP加载数据集和自定义数据数据集
本文主要是讲解如何使用PaddleNLP中的 load_dataset()方法,包含如何加载内置数据集和自定义数据集。
2022-03-29 21:15:17 4538
原创 Transformer
文章目录Transformer1.从宏观的视角开始2.引入张量3.编码层详解(1).从宏观视角看自注意力机制(2).从微观视角看自注意力机制(3).多头注意力机制(5).使用位置编码表示序列的顺序???(6).残差模块4.解码组件(1).最终的线性变换和Softmax层Transformer1.从宏观的视角开始首先将这个模型看成是一个黑箱操作。在机器翻译中,就是输入一种语言,输出另一种语言。拆开这个黑箱,它是由编码组件、解码组件和它们之间的连接组成。**所有的编码器在结构上都是相同的,但它们没
2022-03-28 21:55:46 825
原创 生成式对抗网络(GAN)
文章目录生成式对抗网络(GAN)GAN的原理训练过程目标函数代码生成式对抗网络(GAN)GAN的初衷就是生成不存在于真实世界的数据应用场景如下:AI作家,AI画家等需要创造力的AI体;将模糊图变清晰(去雨,去雾,去抖动,去马赛克等),这需要AI具有所谓的“想象力”,能脑补情节;进行数据增强,根据已有数据生成更多新数据供以feed,可以减缓模型过拟合现象。GAN的原理GAN有两个网络分别为:G(Generator),生成器: 负责凭空捏造数据出来 接收一个随机的噪声z,通过这个噪声生
2022-03-28 21:36:35 2376
原创 实体关系抽取
文章目录监督学习半监督学习方法远程监督Bootstrapping实体关系抽取发展监督学习在给定实体对的情况下,根据句子上下文对实体关系进行预测,执行流程为:预先定义好关系的类别。人工标注一些数据。设计特征表示。选择一个分类方法。(SVM、NN、朴素贝叶斯)评估方法。其优点为准确率高,标注的数据越多越准确。缺点为标注数据的成本太高,不能扩展新的关系。半监督学习方法前面的监督学习效果虽好,但有标注数据集的获取困难。因此可以借助半监督学习的方法,此处又分为远程监督学
2022-03-28 21:28:50 2094 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人