xiyou__-CSDN博客

原创 pytorch: 四种方法解决RuntimeError: CUDA out of memory. Tried to allocate ... MiB

Bug：RuntimeError: CUDA out of memory. Tried to allocate … MiB解决方法：法一：调小batch_size，设到4基本上能解决问题，如果还不行，该方法pass。法二：在报错处、代码关键节点（一个epoch跑完…）插入以下代码（目的是定时清内存）：import torch, gcgc.collect()torch.cuda.empty_cache()法三（常用方法）：在测试阶段和验证阶段前插入代码 with torch.no_gr

2021-07-06 20:44:08 209249 71

原创数据处理入门：自然语言处理NLP常用文本预处理操作整理

常用文本预处理操作。

2021-04-02 14:26:58 5832 1

原创 tkinter实现一个GUI界面-快速入手

适用于新手需要为自己的程序实现一个前端界面。

2024-06-19 10:37:14 721

原创 Pandas 常用操作（持续更新）

DataFrame在实际使用中常用的操作代码。

2024-06-17 14:38:10 427

原创 jupyter快速实现单标签及多标签多分类的文本分类BERT模型

jupyter快速实现单标签及多标签多分类的文本分类BERT模型。

2024-01-05 16:02:59 1335

原创 SentiBank Dector上手指南

官网链接：https://www.ee.columbia.edu/ln/dvmm/vso/download/sentibank.htmlSentiBank Detector可以抽取图片中的形容词-名词对，之前一直看到，这次复现模型才第一次用到，上手的时候有点手足无措，因为官网在如何使用方面说的不是很清楚，但是用完发现也挺简单，这里记录一下。

2023-04-29 15:00:27 2156 14

原创 latex入门指南：插入图片、表格、公式方法一览

latex论文编辑指南

2023-03-09 11:41:31 20912 1

原创 GPT系列学习笔记：GPT、GPT2、GPT3

GPT、GPT2、GPT3的区别和联系。

2022-08-19 11:22:58 9910 2

原创中文词向量word2vec计算相似度

基于word2vec词向量计算中文词语之间的相似度。

2022-07-06 15:59:26 1562 2

原创 TensorboardX：如何在pytorch上画loss曲线图 | TensorboardX入门使用指南

TensorboardX入门使用指南

2022-07-05 14:53:57 5334

原创 DL论文词汇积累（持更）

深度学习领域论文词汇的阅读与积累。

2022-06-25 14:24:11 673

原创 WordPiece 和 BPE 的区别

区分WordPiece和BPE

2022-06-21 17:29:30 5239 1

原创百面机器学习阅读笔记（二）：集成学习

百面机器学习第12章：集成学习部分复习内容。

2022-04-27 23:02:34 1706

原创百面机器学习阅读笔记（一）：模型评估

阅读《百面机器学习》第二章部分内容。

2022-03-30 11:42:43 2024

原创论文阅读：An Empirical Study of Training End-to-End Vision-and-Language Transformers

摘要提出Multimodal End-to-end TransformER framework，即METER，通过这个框架研究如何以一个端到端的方式( in an end-to-end manner )设计和预训练一个完全基于transformer的视觉语言模型。端到端指的是输入是原始数据，输出是最后的结果，整个模型过程相当于黑箱操作；相反，非端到端的方法，数据的预处理部分是单独的模块，需要人工处理（如人工标注数据，人工提取图片特征）（笔者注）具体地，模型从多个维度被解剖(dissect)为：视

2022-02-25 18:52:40 3039

原创 Jupyter Notebook对数据集进行数据分析数据统计(含：样本数量/样本长度/样本长度分布图/示例样本打印)

以下内容可直接以写入.ipynb文件的形式，放入服务器上任意已准备好数据集的文件夹下：导入模块import osimport jsonimport refrom collections import defaultdict绘图函数def draw(dic): #输入样本数量统计字典 import numpy as np import matplotlib.pyplot as plt from matplotlib.ticker import MaxNLocat

2022-02-25 12:30:15 6149

原创 bert的变形：RoBERTa 和 BERT 的异同

RoBERTa和BERT对比。

2021-12-28 16:10:49 8380

原创谷歌翻译 google translation API github开源实践

google translation API 无限量翻译

2021-12-27 14:46:24 3192

原创多模态bert的变形：VisualBERT 和 BERT 的异同

BERTVisualBERT备注全称Bidirectional Encoder Representations from Transformers区别于传统Transformer使用双向 (bidirectional) self-attention集成了 BERT, Transformer-based model for NLP, object proposals systems such as Faster-RCNN预训练数据集wikiCOCO ima...

2021-12-18 16:29:53 1110

原创跑通mmf：visualBert实现过程

使用代码github链接：https://github.com/di-dimitrov/propaganda-techniques-in-memes该代码相当在mmf-master上展开自己的任务，之前想直接跑通facebook的MMF，但是在环境配置问题上屡屡碰壁，后来被推荐了这套代码，才跑通了visualBert模型。实现过程1 将项目下载并存放到服务器2 Install MMFPrerequisites - generating image caption features for Vi

2021-12-13 10:14:23 2957 4

原创使用os.path.join无效/不起作用的原因

os.path.join(a,b)在以下情况下会起不到连接作用，并返回b:a,b中存在一个为绝对路径，即不是patha/pathb的形式，而是/patha/pathb的形式

2021-11-30 10:57:28 2507

原创解决合并压缩包分卷无法解压错误信息：文件格式未知或者压缩文件数据已经损坏

问题起因：我想要获取Semantic Image-Text-Classes - Datasets - Forschungsdaten-Repositorium der LUH (uni-hannover.de)中的数据集，该数据集的train被分为了49个分卷，当我按照他的要求下载了所有的分卷并执行cat train.tar.part* > train_concat.tar合并分卷后，却无法打开或解压压缩包，报错内容如下（打开压缩包时弹出错误）：（文件格式未知或者压缩文件数据已损坏。）最后

2021-11-25 10:12:41 12235

原创 matplotlib使用（二）：绘制一个简单的双柱状图

import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.ticker import MaxNLocatorfrom collections import namedtuplefig, ax = plt.subplots()n_groups = 6 #列数data1=(6,8,10,12,14,16) #柱状1的每一列对应的数据data2=(7,8,9,13,13,15) #柱状2每一列对应的数据bar_width

2021-11-23 16:39:38 3365

原创 matplotlib使用（一）：绘制一个简单的柱状图

import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.ticker import MaxNLocatorfrom collections import namedtuplefig, ax = plt.subplots()n_groups = 6 #列数data=(6,8,10,12,14,16) #每一列对应的数据index=('a','b','c','d','e','f') #横坐标bar_width = 0.

2021-11-23 15:57:57 1178

原创对image caption任务做evaluation（计算Bleu1，Bleu2，Bleu3，Bleu4，METEOR，ROUGE_L，CIDEr）

用到一两个image caption任务的模型，模型中没有给出性能评估的方法，于是在github上找到了一个能够评估image caption的模型，该模型能够提供常见的评价指标的结果，包括Bleu1，Bleu2，Bleu3，Bleu4，METEOR，ROUGE_L，CIDEr，SkipThoughtsCosineSimilarity，EmbeddingAverageCosineSimilarity，VectorExtremaCosineSimilarity，GreedyMatchingScore。git

2021-11-23 15:29:37 1646

原创 AdaptiveAvgPool2d理解（中网、外网整合)

结合中网和外网关于pytorch的AdaptiveAvg2d的优秀解答，并结合自己的理解，分析了AdaptiveAvg2d和一般池化的区别，并举实例帮助理解。

2021-11-12 15:51:18 29690 8

原创影响pytorch、cuda实现的一些原因

最近在给实验配置环境的过程中，频繁的碰到cuda错误，故记录最近的一些错误经验。首先，pytorch一定要和cuda版本对应，具体查看官网在显卡Tesla K40m上，即使使用了cuda10.1和其对应的torch == 1.6.0+cu101，也无法正常使用，报错RuntimeError: CUDA error: no kernel image is available for execution on the device，原因是Tesla K40m的算力为3.5，而pytorch1.3+要求算力

2021-10-12 15:32:35 762

空空如也

空空如也