自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 自然语言处理——结构化数据问答

结构化数据问答笔记

2022-04-07 21:35:50 1686

原创 python读写xlsx、tsv、csv文件

python读写xlsx文件、tsv文件、csv文件的一些方法

2022-03-30 22:22:57 2317

原创 PaddleNLP加载数据集和自定义数据数据集

本文主要是讲解如何使用PaddleNLP中的 load_dataset()方法,包含如何加载内置数据集和自定义数据集。

2022-03-29 21:15:17 4538

原创 Transformer

文章目录Transformer1.从宏观的视角开始2.引入张量3.编码层详解(1).从宏观视角看自注意力机制(2).从微观视角看自注意力机制(3).多头注意力机制(5).使用位置编码表示序列的顺序???(6).残差模块4.解码组件(1).最终的线性变换和Softmax层Transformer1.从宏观的视角开始首先将这个模型看成是一个黑箱操作。在机器翻译中,就是输入一种语言,输出另一种语言。拆开这个黑箱,它是由编码组件、解码组件和它们之间的连接组成。**所有的编码器在结构上都是相同的,但它们没

2022-03-28 21:55:46 825

原创 生成式对抗网络(GAN)

文章目录生成式对抗网络(GAN)GAN的原理训练过程目标函数代码生成式对抗网络(GAN)GAN的初衷就是生成不存在于真实世界的数据应用场景如下:AI作家,AI画家等需要创造力的AI体;将模糊图变清晰(去雨,去雾,去抖动,去马赛克等),这需要AI具有所谓的“想象力”,能脑补情节;进行数据增强,根据已有数据生成更多新数据供以feed,可以减缓模型过拟合现象。GAN的原理GAN有两个网络分别为:G(Generator),生成器: 负责凭空捏造数据出来​ 接收一个随机的噪声z,通过这个噪声生

2022-03-28 21:36:35 2376

原创 实体关系抽取

文章目录监督学习半监督学习方法远程监督Bootstrapping实体关系抽取发展监督学习在给定实体对的情况下,根据句子上下文对实体关系进行预测,执行流程为:预先定义好关系的类别。人工标注一些数据。设计特征表示。选择一个分类方法。(SVM、NN、朴素贝叶斯)评估方法。其优点为准确率高,标注的数据越多越准确。缺点为标注数据的成本太高,不能扩展新的关系。半监督学习方法前面的监督学习效果虽好,但有标注数据集的获取困难。因此可以借助半监督学习的方法,此处又分为远程监督学

2022-03-28 21:28:50 2094 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除