小千不爱内卷-CSDN博客

原创 Pytorch单机多卡分布式训练

Pytorch单机多卡分布式训练

2023-09-27 16:03:56 622 1

而图注意力网络，利用可训练的参数W和可训练的注意力网络a（实际上感觉就是一个全连接层，也是一个可训练的W）来模拟各个邻域节点对当前节点的重要程度，相当于真正实现了图像中的卷积神经网络中可训练的卷积核，因此在图学习的各个数据集上达到了新的高度，同时利用“多头注意力”，实际上更像是卷积神经网络中的多个卷积核，增加了特征提取的广度和深度，性能进一步得到提升。2：表示每个节点的邻域的大小，或者说每个节点搜寻相邻节点的深度，再或者说每个节点想要聚合特征的节点范围的大小。这样我们就能对一个大的矩阵做运算，实现并行。

2023-05-25 10:45:29 825 1

原创 Git常用命令大全

Git常用命令大全

2023-05-10 17:22:02 618 2

原创 ELECTRA：将文本编码器作为判别器而不是生成器进行预训练

相比于随机替换成其他token，使用一个生成器将生成的内容替换mask，使得生成的这个词比随机替换的词在语义上更接近真实词语，这就使得判别器需要更加深入理解上下文语意才能判别出这个词语是否被替换掉，提升了判别器的理解能力。也就是用xt的token embedding点乘生成器经过编码后的xt的embedding，然后除以所有的x的token embedding点乘的和，算出一个概率，找出最大的概率。生成器的输出用的是一个softmax，算出[mask]，也就是x位置是xt的概率，并找出最大概率作为输出。

2023-04-23 16:40:06 187 1

no1xiaoqianqian的博客

原创 Pytorch单机多卡分布式训练

原创图学习 [1]

原创 Git常用命令大全

原创 ELECTRA：将文本编码器作为判别器而不是生成器进行预训练

原创 Bart：用于生成、翻译、理解的去噪的序列到序列的预训练语言模型

原创 Java发送请求 & SpringBoot定时任务 & Java执行Linux终端命令

原创强化学习 [入门]

原创推荐算法 [1] 传统机器学习推荐算法

原创文本生成 [1] 文本生成任务&评分指标

原创 [Python库] matplotlib

原创多模型分类结果投票融合

原创 Python工具（导包问题、pickle协议问题、argparse用法、configparser用法、assert、difference求差集）

翻译 [论文阅读] Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts（MMoE模型）

原创支持向量机（SVM），适合初学者读的一篇博客

原创 [阅读论文] RoCBert: Robust Chinese Bert with Multimodal Contrastive Pretraining

原创 Vue SpringBoot项目部署到服务器

原创 SpringBoot：集成JWT

原创 SpringBoot：常用依赖

原创 SpringBoot：后端文件夹框架

原创 Springboot：entity的设计

原创 Vue学习

原创 Request.js封装

原创 Springboot集成Swagger工具

原创 SpringBoot解决跨域问题、无法分页查询问题

原创阅读文献“Learning Transferable Visual Models From Natural Language Supervision”（CLIP）

原创阅读文献“Language Models are Unsupervised Multitask Learner”（GPT-2）

原创阅读文献：“Improving Language Understanding by Generative Pre-Training”（GPT模型）

原创综述类文献 “Pre-trained Models for Natural Language Processing: A Survey”

原创 Mediapipe手势识别

原创 HuggingFace API学习（2）

原创 HuggingFace API学习（1）

原创自然语言处理：入门基本知识

原创 FashionGen数据集下载

排序算法总结（选择，冒泡，插入，归并，快排）.pdf

空空如也