个人学习
文章平均质量分 77
__萌新
这个人很懒,什么都没写。
展开
-
LSTM及其改进用于视觉任务中
双线性LSTM探秘1、原生LSTM2、双线性LSTM1、原生LSTM原生LSTM任务的公示如下所示:其中ht保存了关于序列的信息,并且被馈入额外的全连接层或卷积层以产生输出。输入xtx_txt和LSTM内存ht−1h_{t-1}ht−1由上述方程中的相加相互作用组合而成。2、双线性LSTM这种提法存在两个问题。首先,匹配操作通常更容易用乘法关系而不是加法关系来表示,一个直观的例子是作为相关度量的内积。其次,在同一个LSTM记忆向量中很难存储和清晰区分多个不同的外观,但在多目标跟踪中,在不同原创 2021-02-02 20:31:31 · 839 阅读 · 0 评论 -
Focal loss理解
参考链接:https://www.cnblogs.com/king-lps/p/9497836.html最近看文献一直看到这个损失函数,索性记录一下。这里写目录标题1. 总述2. 损失函数形式3. 小结4. 个人看法1. 总述Focal loss主要是为了解决one-stage目标检测中正负样本比例严重失衡的问题。该损失函数降低了大量简单负样本在训练中所占的权重,也可理解为一种困难样本挖掘。2. 损失函数形式Focal loss是在交叉熵损失函数基础上进行的修改,首先回顾二分类交叉上损失:是原创 2021-01-05 17:03:20 · 410 阅读 · 0 评论 -
《First Order Motion Model for Image Animation》论文解读
论文解读1、前言2、解读3、整体概述4、细节讲解1、前言早期的Facerig软件可以即时抓取摄像头视频中的人脸关键点,将表情、头部姿态等信息转化到三维虚拟化身上,比如一只猫、一个虚拟卡通人物上。然后在使用即时视频通讯软件时,选择facerig的虚拟摄像头,其他人看到的就是拥有使用者当前表情的虚拟形象了。随着换脸、表情迁移的科技浪潮汹涌而至,人们不再满足于使用卡通形象、动漫人物来充当自己的化身,而是使用真人的形象。类似的项目包括但不限于faceit_live3、avatarify,其中avatarify原创 2020-08-07 16:47:31 · 3964 阅读 · 1 评论 -
目标检测数据集制作常用脚本集合
常用脚本集合1、VOC格式篇二级目录三级目录1、VOC格式篇这个代码的用途是将annotations下的xml文件转换成txt形式的labels。# 第二步运行import xml.etree.ElementTree as ETimport pickleimport osfrom os import listdir, getcwdfrom os.path import joinsets=[('2007', 'train'), ('2007', 'val'), ('2007', 'test'原创 2020-07-27 17:14:39 · 358 阅读 · 1 评论 -
Keras之模型拼接
早上起来看到一篇微信公众号推文,看到了新冠肺炎检测的demo,于是阅读起了源代码,原文链接:https://mp.weixin.qq.com/s?__biz=MzUzODkxNzQzMw==&mid=2247484133&idx=1&sn=a4fdd0a6f3a884e94d973f4ca308ab0f&chksm=fad12db3cda6a4a56f3eb5225...原创 2020-03-18 09:51:32 · 1824 阅读 · 0 评论 -
神经网络反向传播寻找极小值小实例
废话不多说,放几张图上来。找到这个函数的极小值点,用机器学习的方法,简单来说就是利用梯度下降去更新权值。代码如下:import numpy as npfrom mpl_tookkits.mplot3d import Axes3Dfrom matplotlibs import pyplot as pltimport torchdef himmelblau(x): re...原创 2020-11-28 10:20:15 · 470 阅读 · 2 评论 -
Faster RCNN杂谈
Faster RCNN:训练的时候才需要区分正、负样本吗?ROI生成的256个感兴趣区域是怎么产生最后的预测结果的?通过全连接层,得到长度为4096的256个ROI特征,将上述特征输入分类与回归的全连网络。默认为21类物体,分类网络输出的特征维度是21维,回归网络输出每一个类别下的4个位置偏移量,输出的特征维度是84。一张图片生成一张特征图,特征图上产生Anchors,产生37x50x9个A...原创 2020-02-29 17:32:51 · 225 阅读 · 2 评论 -
【论文解读】Cross-dataset Training for Class Increasing Object Detection
标题:关于类增长目标检测的跨数据集训练文章贡献:文章提出了一个概念简单,灵活且通用的框架,这个框架可以针对跨数据集训练目标检测网络。给定针对不同对象类的两个或多个已标记的数据集,交叉数据集训练旨在检测不同类的联合,这样我们就不必为所有数据集标记所有类。 当使用交叉数据集训练方法的时候,我们只需要标记新数据集里的新标签。 上图是交...原创 2020-04-11 16:22:56 · 1407 阅读 · 0 评论 -
Pytorch中expand_as()函数详解
关于expand_as()的个人理解from __future__ import print_functionimport torch as t# a = t.Tensor(2,3)## print(a)# b = t.Tensor([[1,2,3],[4,5,6]]) # 用list的数据创建tensor## print(b)## print(b.size())##...原创 2019-12-31 10:47:46 · 3979 阅读 · 2 评论 -
Pytorch基础语法学习
12月30日学习记录学习了Pytorch的基本语法,包含以下几个import torch as timport numpy as npt.size()t.shape()t.numel()a = t.arange(0,6)b = t.eye()c = t.view()a = t.squeeze()b = t.unsqueeze()c = t.re...原创 2020-05-03 23:18:57 · 369 阅读 · 0 评论