- 博客(6)
- 收藏
- 关注
翻译 (CVPR2020)论文笔记:Visual Commonsense Representation Learning via Causal Inference
图像标题与因果推断结合的一篇论文
2023-02-16 14:32:02 374
原创 文本向量化的方法
文本向量化one-hot 编码word embedding因为文本不能直接输入到模型当中从而进行相关计算,所以需要首先需要将文本转换为向量的形式。把文本转换成向量化的方法主要有两种:转换成one-hot编码转换成word embeddingone-hot 编码在使用one-hot编码中,我们常常是将每一个token使用一个长度为N的向量来表示,N通常等于编码中词典的数量。通常是先将待处理的文本进行分词或者N-gram预处理,去除重复后得到相应的词典。例如词典中有4个词语:{‘项目’,‘电脑
2022-05-06 21:52:48 5073
原创 PyTorch数据加载方法
PyTorch数据加载方法数据集介绍Dataset类的使用详解DataLoader类的使用详解数据集介绍本文使用的数据集为开源的本文分类数据集SMS Spam Collection Data Set,下载地址为https://archive.ics.uci.edu/ml/datasets/SMS+Spam+Collection数据集是从 Grumbletext 网站手动提取了 425 条 SMS 垃圾邮件的集合,由一个文本文件构成,其中每一行都是有一个类别和后面的原始消息构成。Dataset类的使
2022-05-02 21:28:10 672
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人