特征提取和预训练
文章平均质量分 78
特征提取和预训练
MallocLu
生命不息,搬砖不止
展开
-
使用TimeSfomer提取视频特征
原论文github将ViT适配到视频,较3D Conv精度很小的下降但速度显著提高,可以用于更长时间的视频(超过一分钟)。Bert的Add&Norm在后面,即Multi-head Attention -> Add&Norm -> Feed Forward -> Add&Norm,所以最后的输出特征是LayerNorm之后的,不需要LayerNorm后再使用。ViT系列的Add&Norm在前面,即Norm -> Multi-head Attention -> Add -> Norm -> Feed Forw原创 2022-09-20 16:08:32 · 619 阅读 · 1 评论 -
使用Glove提取单词特征
在2013年Tomas Mikolov等人提出word2vec之后,2014年,Jeffrey Pennington, Richard Socher, Christopher D. Manning三人提出了GloVe算法。其中,GloVe是Global Vector的缩写。原创 2022-08-31 18:17:37 · 1057 阅读 · 0 评论 -
使用Detectron2目标检测&特征提取
官网githubFaster R-CNN原论文R-CNN Fast R-CNN Faster R-CNN视频讲解Detectron2是Facebook AI Research的下一代库,提供最先进的检测和分割算法。它是Detectron和maskrcnn-benchmark的继承者。它支持Facebook中的许多计算机视觉研究项目和生产应用。演示为ubuntu16.04下cpu版本的安装和使用。原创 2022-09-06 15:26:59 · 1480 阅读 · 2 评论 -
CLIP使用
# 安装环境# 1. 环境安装pytorch# 2. 安装tqdmpip install ftfy regex tqdm# 3. 安装clippip install git+https://github.com/openai/CLIP.git # 内网使用pip install git+https://github.91chi.fun/https://github.com/openai/CLIP.gitAPI# 1. 返回可以用的模型clip.available_models(原创 2022-05-30 19:41:02 · 8241 阅读 · 9 评论 -
使用SceneGraphParser解析语句
受到的启发创建。Stanford Scene Graph Parser,斯坦福场景图解析器,场景图是一种基于图的图像内容语义表示。它们对图像中的对象、它们的属性和对象之间的关系进行编码。Scene Graph Parser,场景图解析器,将语句(自然语言)解析为场景图(实体及其关系)。原创 2022-09-05 21:20:29 · 870 阅读 · 0 评论 -
安装skip-thoughts提取句子特征
链接:https://pan.baidu.com/s/12x_6hrEX-rWw1TluQO5UdQ?从下方百度网盘中下载2个压缩包,解压后进入skip-thoughts-master目录。运行data目录下的main.py。原创 2022-08-23 22:23:26 · 547 阅读 · 0 评论 -
安装Wikipedia2Vec提取单词特征
官网使用English Dump of Wikipedia训练的skip-gram model模型提取单词特征向量注意转换前将 单词转为小写,否则可能word2vec失败(即wikipedia2vec中是小写单词与feature vector之间的对应关系)原创 2022-08-25 16:14:46 · 1193 阅读 · 0 评论 -
安装C3D v1.0提取视频特征
c3d v1.0安装原创 2022-07-07 14:36:34 · 725 阅读 · 2 评论