自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 image captioning综述入门二

0.入门二《Deep Visual-Semantic Alignments for Generating Image Descriptions》1.Show and Tell:神经图像字幕生成器 2015原理:利用了机器翻译的思想,将图像提取出抽象的特征,再将特征作为输入来生成自然语言,如下图:模型优化目标:其中,I代表图像,S代表对应的描述,θ代表模型的参数。在给定图像和参数时使生成描述S的概率最大,从而得到参数,以此来训练模型。论文链接:https://arxiv.org/pdf/141

2021-10-11 22:02:05 594

原创 Image Captioning综述——入门

Image Captioning综述Image caption——图像理解——看图说话综述(2015-2018)https://blog.csdn.net/m0_37731749/article/details/805201440.入门一《Deep Fragment Embeddings for Bidirectional Image Sentence Mapping》2014NIPS解决问题:集中在retrieval(检索)的问题上,没有生成description(描述)。模型结构:输入数据

2021-10-09 21:58:02 648

原创 mmdetection v2.0训练自己的voc数据集

修改步骤首先按照 链接进行修改mmdetection中对应文件代码,但是有可能会报下面这个错误:AssertionError: The `num_classes` (3) in Shared2FCBBoxHead of MMDataParallel does not matches the length of `CLASSES` 20) in RepeatDataset原因分析:数据集的类别信息(我的数据集类别是3)仍是VOC类别(20类)。解决办法:在修改完 class_names.py 和

2021-04-07 10:26:28 2815 6

原创 Python:第(前)K大(小)数问题

第(前)K大数问题指的是在长度为n(n>=k)的乱序数组中找出从大到小顺序的第(前)k个数的问题。算法思路假设数组长度为N,首先取前K个数,构建最小堆,将剩余N-K个元素,依次与堆顶元素进行比较,若大于堆顶元素,则替换,并重新为最小堆。代码# 构建最小堆 def min_heap(self, parent, heap): child = 2 * par...

2021-03-18 20:32:52 687

原创 json.decoder.JSONDecodeError:Extra data: line 1 column 8020226(char 8020225)

运行一下程序时:报错:原因分析:json文件中有两条记录,并且json.loads()无法解码多个记录。你需要按记录进行记录。简单点说就是你可能之前已经生成了一个json文件,再次运行时就会报这样的错误。解决办法将要打开的json文件(如下Garbagetest.json重命名)重命名,再运行。...

2020-03-20 15:39:52 14080 2

原创 图像处理基础一(MATLAB编程)

一、图像灰度直方图随机生成矩阵,统计其灰度直方图f=rand(100,100);g=round(255*f); %%round四舍五入到最近的数。Matlab取整函数有: fix, floor, ceil, round.的区别。链接:http://www.cnblogs.com/york-hust/p/3238714.htmlh=zeros(1,256); %%%zeros(256)...

2019-09-08 14:59:31 400 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除