自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(57)
  • 收藏
  • 关注

原创 FlowNet2环境配置踩坑实录

FlowNet2是光流估计领域的经典工作,从事相关研究应用都难免引用这个工作。讲道理他的易用性在当年做的还是不错的,环境配置的主要问题是过于古早的Pytorch和Cuda版本和谜一样的c系语言报错。...

2022-07-07 10:48:06 630 2

原创 【算法笔记】Diadem Metric

前言本来想百度一下偷懒的,发现Diadem metric这个东西还没人翻译过。可能大家看一遍就懂了orz。我的话,通读了一边没能把上下文连接起来,干脆也翻译一下(传统艺能)具体步骤测试树上的节点都必须在目标节点的欧几里得距离阈值内,无论是什么类型的点,都必须匹配。具体来说的阈值是一个圆柱体。需要对每一个匹配的测试节点测试其连接性,基于从目标节点到与目标节点的祖先匹配的祖先的路径...

2019-10-26 21:39:54 628

原创 【文献翻译】自动神经元追踪方法:一种新方法

摘要这篇文章调查了最新可获得的神经追踪方法,同时也选取了一些有显著意义的老文章,在适当的位置提出建议。他们被分类为全局处理方法,局部处理方法,元算法方法。进一步的,我们会指出每一种方法的算法组成,同时我们会指出各个方法使用的数据集信息和评价指标。分类我们将方法分为全局方法,局部方法和元算法方法:全局算法处理整张图片,局部方法只探索相关结构,元算法不依赖特定的追踪算法,而是对已经存在的算法进...

2019-10-19 16:26:23 728

原创 【综述1】

透视图中的神经元路径本文是一篇综述,在从显微镜图像提取神经元信息这个领域,本文做了相关调查以及各种不同方向的总结。包括:图像分割方法神经元形态的定量测量目前可用的软件工具与形态数据库0. 介绍理解大脑的工作原理无疑是当今科学最大的挑战之一。获得神经系统在分子,细胞和系统层面上,结构,功能,和发展的深刻理解,有着极其重要的作用。因为这些层面上的流程与高阶认知功能有复杂的联系,而且是治...

2019-10-13 01:11:45 217

原创 【复试之前的总结】

已经经历四次面试了,现在来做一个总结,主要是面试时候没回答好的问题,还有一部分心态调整的内容。1. 北京面试最大问题:数学不好,浙大面试可能问道,挑一门重点复习一下,特别是用英语表述。有没有对什么问题有深入研究?我当时回答了损失函数优化的研究,但是损失函数基本忘了,没说清楚。现在想来还是不太合适,因为这个部分只是看,没有深入思考过,更没有实际操作过。总之,一知半解。现在想来,还是挑A...

2019-09-19 09:15:09 173

翻译 【论文笔记】Dynamic Hypergraph Structure Learning(动态超球体结构学习)

主要内容翻译:最近这些年,超球体模型已经在许多例子的相关公式中展示了它的优越性,并且广泛应用于分类,回归和其他任务中。在所有这些任务中,超球体学习的表现高度依赖于生成的超球体结构。一个优秀的超球体结构可以更好地表达数据之间的关联,而且反过来也是一样。虽然超球体最近吸引到了不少关注,大多数现有的超球体结构依然依赖静态超球体结构,而且几乎没有在学习过程中优化超球体结构这一方向的努力。为了解决这个问...

2019-08-25 17:46:51 1215

转载 【文章整理】CVPR 图像文本生成/GAN 方向文章概要整理

Event-based High Dynamic Range Image and Very High Frame Rate Video Generation using Conditional Generative Adversarial Networks使用有条件的GAN进行基于事件的高动态性区域图像和极高帧率视频生成摘要: 使用Conditional GAN实现了基于事件摄像机的从一个数...

2019-07-19 17:47:40 705

原创 【论文笔记】Mixture Density Generative Adversarial Networks 混合密度生成对抗网络

论文地址:https://arxiv.org/pdf/1811.00152.pdf1. 摘要翻译:传统的GAN存在模型崩溃的风险。因此本文提出了一种称为混合密度GAN的变体,通过鼓励分类器在它的嵌入空间形成聚类来解决模型崩溃的问题。以此轮流引导产生器利用这个聚类并发现数据中不同的模型。这是通过将高斯密度函数定位在单纯形的角上,将得到的高斯混合作为鉴频器嵌入上的似然函数,并根据这些似然性为GAN...

2019-07-19 17:47:11 1278 1

转载 【算法笔记】CycleGan 循环生成对抗网络

原文:https://blog.csdn.net/qq_21190081/article/details/78807931https://www.jianshu.com/p/64bf39804c801. 单向 GANhttps://blog.csdn.net/nymph_h/article/details/964329202. 循环 GAN而循环对抗生成网络可以看作两个普通的GAN...

2019-07-19 11:22:48 4551

转载 【算法笔记】GAN 生成对抗网络

参考:https://www.cnblogs.com/bonelee/p/9166084.htmlhttps://www.cnblogs.com/DicksonJYL/p/9698877.html1. 生成(Generator)模型通过学习一些数据,然后生成类似的数据。比如让模型学习很多动物图片,最终计算机就可以自行生成动物图片了训练完成后,即使没有NN Encoder,输入一段...

2019-07-18 16:52:29 602

转载 【算法笔记】域适应(Domain Adaptation)

首先感谢原博主:https://www.cnblogs.com/Terrypython/p/10645520.html1. 定义在迁移学习中, 当源域和目标的数据分布不同 ,但两个任务相同时,这种特殊的迁移学习叫做域适应 (Domain Adaptation)。比如说,我们要实现一个自动区分垃圾邮件的算法。源数据是我的邮箱中的数据。现在要用这个算法对我朋友邮箱中的邮件进行分类。那么这就是两个...

2019-07-18 10:32:52 8409

原创 【论文笔记】一种适用于基于骨骼的动作识别的增强图卷积LSTM网络

1. 摘要翻译基于骨骼的动作识别是一项重要的任务,它要求从给定的骨骼序列中充分理解人类动作的运动特征。最近的研究表明,研究骨骼序列的空间和时间特征对这个任务是非常重要的。除此之外,如何提取不同的时空特征仍然是一项具有挑战性的工作。在这篇文章中,我们提出了一种注意力增强图卷积LSTM网络,来从骨骼数据中进行人体动作识别。文章提出的AGC-LSTM不仅可以捕捉空间构型和时间动态的判别特征,而且可以探...

2019-07-15 11:32:24 1615

原创 【论文笔记】基于带有不确定性的边界框回归的准确目标检测

1. 摘要翻译大尺度目标检测数据集试图尽可能清楚地定义被识别图像的真实边界框。 但我们还是注意到标注边界框的时候还是有不少混淆的地方。在这篇文章中,我们提出了一种新颖的边界框回归损失函数,可以同时进行边界框的转换和变量的确定。我们的损失函数在集中结构中极大地提高了定位的准确性,并且几乎没有额外的计算量。The learned localization variance allows us to ...

2019-07-14 22:32:30 1078 1

原创 【论文笔记】基于深度超球面多样化嵌入的人体重确认

1. 摘要翻译许多当前成功的人体识别系统用softmax损失函数来训练一个模型,以此同时对不同人进行分类并得到特征向量。然而潜在的特征嵌入空间被忽视了。这篇文章中,我们使用了一个经过修改的Softmax Loss函数,称为球面Softmax Loss函数,来同时解决分类问题并训练一个超球面流形分类问题。同时介绍了一种平衡的抽样策略,最后,我们提出了一种称为SphereReID的深度卷积神经网络,...

2019-07-12 14:42:20 418

原创 【论文笔记】基于大边缘余弦损失函数的深度人脸识别(LMCL)

1. 摘要翻译本篇文章中,我们提出了一个新颖的损失函数,称之为LMCL,来给出loss函数的一种不同思路。更确切地说,我们用L2范数(欧几里得范数)归一化softmax损失函数的特征和权值向量,消除半径方差的影响,重构为余弦损失函数。基于此,提出了一个余弦边界项来更深地最大化角度空间地决策边界。结果是,通过正则化和余弦决策边界地最大化的优点,成功实现了类内间距的最小化和类之间距离的最大化。我们称...

2019-07-12 11:34:04 1405

转载 【方向整理】损失函数改进方法

首先感谢原文作者: https://blog.csdn.net/u014380165/article/details/769463581. 总结看过五种基本的损失函数改进之后,对损失函数的改进方向有了一个基本的认识。这五个方向的改进大概分为两类,1,2,3,5一类,4一类1.2.3.5 角度化改进与中心点改进这一类改进方法的核心是尽可能使同一类分类结果集中,不同类分类结果分散。1,2...

2019-07-10 16:28:23 6599

转载 【算法笔记】交叉熵的含义以及在机器学习中的应用

感谢原文: https://blog.csdn.net/tsyccnh/article/details/79163834总结:熵用来表示一个随机变量信息量的期望;相对熵(KL散度) 用来衡量随机变量不同分布之间的差异。在机器学习的分类问题中,P表示标准分类结果,Q表示学习得到的分类结果,那么P和Q之间的相对熵越小,就说明Q的分类效果越好(接近正确结果P)。训练的目的就是获得更加标注的分布Q,...

2019-07-10 14:04:49 141

原创 【算法笔记】SoftMax函数

上半部分说明softmax的工作方式,下半部分说明softmax操作后怎么进行BP操作

2019-07-09 14:03:35 111

转载 【数学知识】||x||(范数 norm)

1. 范数的含义与定义范数(norm)是数学中的一种基本概念,是具有“长度”概念的函数。  在泛函分析中,它定义在赋范线性空间中,并满足一定的条件,即①非负性;②齐次性;③三角不等式。它常常被用来度量某个向量空间(或矩阵)中的每个向量的长度或大小。  在线性代数、泛函分析及相关的数学领域,范数是一个函数,是矢量空间内的所有矢量赋予非零的正长度或大小。半范数可以为非零的矢量赋予零长度。2....

2019-07-08 17:12:50 33105

原创 【接下来的方向】二零一九年七月八日

1. 对于OpenPose考虑半截手势的识别方法,增加识别点?对边缘区域特殊判断?考虑修改损失函数,对损失函数进行优化(总结各类范式)考虑NP-Hard问题的不同解决方法2. 问题的总结openpose中(3),(4)公式的W§真的不是权重公式吗?原文: W is a binary mask with W§ = 0 when the annotation is missing a...

2019-07-08 15:53:52 378

转载 【算法笔记】Faster-RCNN

1. 算法介绍Faster-RCNN是2016年提出的,整合RCNN,Fast-RCNN的,将传统手势检测的四步操作整合到一个神经网络中,避免重复计算,尽量保证GPU计算。也是YOLO3完成的基础之一。2. 算法流程首先向CNN网络【ZF或VGG-16】输入任意大小图片M×N;经过CNN网络前向传播至最后共享的卷积层,一方面得到供RPN网络输入的特征图,另一方面继续前向传播至特有卷积层...

2019-07-08 10:56:20 210

转载 【算法笔记】深度学习中的优化器Optimizer算法(BGD,SGD,mBGD......)

在阅读文献的时候,看到其中提到“选用了SGD左右优化器算法”,然后找到了这篇详尽地解释了各种优化器算法地文章:https://www.cnblogs.com/guoyaohua/p/8542554.html文中提到的SGD指随机梯度下降法,每次迭代只使用一组训练数据,这样每次迭代不一定都朝着收敛方向去,但总体上是收敛的。...

2019-07-07 15:56:09 1654

原创 【论文笔记】通过多模态训练提高单模态动态手势识别的性能

1. 摘要翻译我们提出了一种高效的算法,来利用多模态的知识训练动态手势识别任务的单模态三维卷积神经网络。和当前许多优秀算法不同的是,我们并不显式地进行多模态信息融合。而是提供了另一种不同框架,其中我们嵌入多模态的知识到单个网络中,由此,每一个单模态网络都可以获得更好的运行效果。特别的,我们为每个可用的模态提供单独的网络结构,并强制他们协作,以发展拥有公共语义和更好表示方法的网络。我们将要介绍一种...

2019-07-07 10:23:52 1824 3

转载 【算法笔记】NMS(non maximum suppression) 非极大值抑制

https://blog.csdn.net/leviopku/article/details/80886386参考上面这篇文章在进行目标检测的时候,可能对同一目标有多个重叠的检测结果。我们只要其中置信度最大的那个,非极大值都忽略掉...

2019-07-06 16:27:40 222

原创 【论文笔记】人体姿态估计网络 Pose Proposal Networks

1. 摘要翻译我们提出了一种新颖的方法来实时检测未知数量的清晰的二维人体姿势。为了解耦从CNN的激活映射中解析像素级别的身体检测的运行时复杂度,我们的方法,称之为Pose Proposal Networks,使用了一种当前最佳的“只拍一次”物体检测范式,这种方法在一个自底向上的姿态检测场景中使用了网格级别的图片激活映射。身体部分和四肢的检测直接通过single-shot CNN进行。这种方法从概...

2019-07-04 17:53:01 1968

原创 【论文笔记】实时多人姿态评估 (OpenPose)Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

1.摘要翻译我们提出了一种高效检测图片中多个人2D姿态的方法。这种方法使用了一种无参表示法,来学习如何将人的身体部分与其个人联系起来, 我们称这种方法为“Part Affinity Fields”。这种结构将全局上下文(全体信息)编码,允许使用一种贪心的自底向上的的解析方法来维持高准确率和实时检测,无论图片中有多少人。这种结构被设计成使用两个分支的相同顺序预测过程,同时学习零件(单个人)的位置和...

2019-07-04 11:54:25 2126

原创 【算法笔记】CNN Convolutional Neural Network (卷积神经网络)

1. 先皮一会久仰CNN的大名,进入新闻界,加入美国有线电视新闻网,成为一个跑得飞快的记者一直是我的梦想。但是,平庸的才能无法让我成为一名空间移动系的法师,现在只能努力成为一名精神系人偶师。话说前两天实验验收,把CNN和RNN搞混了orz,太尴尬了orz,所以现在怎么说也得把他们的概念弄清楚。2. 算法的作用输入:一张图片(长x宽x空间维度(RGB,Spatial Dimensions))...

2019-07-01 13:12:18 252

原创 【论文笔记】基于带有多尺度信息的特征校准网络的实时手势检测

1.文章的研究现状文中提到的手势识别方法一共有三种:基于可穿戴设备,由设备上的传感器传回数据判断手势移动这种方法的弊端在于,设备造价昂贵,可识别的手势不自然基于计算机视觉的方法,弊端在于容易受光照和复杂背景的干扰基本流程:手势分割->特征提取->分类器分类手势分割->通过肤色,纹理,多种模型分割特征提取->人为设定特征分类器分类->神经网络,隐马尔可...

2019-06-29 18:01:36 780

原创 【论文笔记】面向移动 WEB 端的微手势识别技术及应用

【论文笔记】面向移动 WEB 端的微手势识别技术及应用 1. 解决的问题2. 不会的知识点2.1 总2.2 肤色分割2.3 手势特征提取2.4 其他问题3. 核心概念4.流程1. 解决的问题动态手势识别移动端计算力不足的缺陷2. 不会的知识点2.1 总微手势特征提取2.2 肤色分割1. 硬阈值肤色分割, HSV色彩空间含义:H(Hue)色相,什么颜色S(Saturat...

2019-06-28 17:32:13 301

原创 【DP】Codeforces 985 E. Pencils and Boxes

题意:将n只笔放入若干个盒子中,每个盒子至少有k只,每个盒子内最长的笔和最短的笔长度差不超过d,有没有合法的方法?题解:一开始的想法是把笔的长度排序后,对每一只笔二分出第一支不能和它放在一起的笔。将两支笔中间的笔向两边分。但这种方法会改变每次右边 区间的最小值。 正解用到了DP的思想,dp[i] = 1 表示从这支笔开始取到最后一只有合法的放法。 转移方程:如果[i+k,r[i]]区间...

2018-05-27 22:23:34 241

原创 【字符串哈希】URAL1989 Subpalindromes

题意:给定一个字符串,(小于1e5), 有两种操作. 1. 将字符串某一位改成另一个字符。 2. 判断l,r区间内的字符串是不是回文串。思路:因为字符串不停在变化,即使不变,求出每个子段是否回文也要n方。所以将这个字符串看作正反两个26进制的数,如果某一段是回文的,那他在正反两段中的哈希值应该相等。用树状数组区间求和。另外,由于正反串在源串中位置不同,要乘上到串末端距离,消除误差。哈希...

2018-05-27 22:09:11 163

原创 【找规律二分】Educational Codeforces Round 44 D-Sand Fortress

找规律 分两种情况 一个是所有数小于等于H,沙堆高度单调递减。 另一个是沙堆高度先增加后减少。 关键是比赛时候把题看错了。 其实画几个样例就好了。#include<bits/stdc++.h>using namespace std;typedef long long LL;LL n,k;int main() { cin>>n>>...

2018-05-26 12:25:29 118

原创 【数学】牛客挑战赛15C 约瑟夫问题

链接:https://www.nowcoder.com/acm/contest/112/C 来源:牛客网约瑟夫问题(https://baike.baidu.com/item/约瑟夫问题),n个人,1 2报数 1出队( 就是体育课的时候1 2报数 1出队,2留下),q次询问,每次求第x个人是第几个出队的我很难过,具体数学白看了 就是当前总人数为奇数时,下一轮报数奇偶要转换(原奇数出列变成...

2018-05-12 23:19:34 582

原创 【树状数组】牛客挑战赛15D 数字串

最近做了不少树状数组的题目,不得不感叹,这真是一个优美的数据结构。起码可以简洁高效地求出数组前缀和。 最近常常碰到的是求一段区间内大于或小于某个数的个数。如果数字范围较大,但不要求修改的话,可以用树状数组存离散化后的数的大小。 比如 1 2 4 4 6 7,离散化 1 2 3 3 4 5,统计个数 0 1 1 2 1 1 每添加一个新数,都看看有没有当前位置结束的区间,用树状数组求一下...

2018-05-12 23:04:10 136

原创 【找规律】hdu6267 CCPC杭州17 D - Master of Random

一个树,0号节点是它的根,1到n-1号节点依次,等概率地认已经确定地节点为爸爸。比如k就等概率地认0-k-1中的一个为爸爸。每个点都有一个权值,随机选一个点,求它子树大小,对所有的树,所有的点,求期望。首先,枚举树所有的情况,再枚举树上所有的点,显然是不现实的。 我们把每个点单独考虑,每个编号的点在每种树中,被选中的概率是多少。 n个点的树有(n-1)!种构造方法 0号节点出现概率为 ...

2018-05-09 23:31:12 856

原创 【18浙江省赛】D - Sequence Swapping (DP)

赛场上队友对着这题狂码130余行,贡献全场1/4的段错误,还是太年轻了。思路是DP 将第i个左括号放在j及j右边能获得的最大收益记为状态。 i号‘(’ 放在 j位 ,则i右边的左括号都在j+1及以后的位置 或者i不放到j位,只沿用i放到j+1时的结果。状态转移方程为:dp[i][j] = max(dp[i+1][j+1]+a[I]*(i右边 i到j的位置差个右括号权值...

2018-05-06 23:05:28 509

原创 【18浙江省赛总结】

场上:6/13 rank89 铜; 补题:10/13 一周完成;这场比赛还是暴露了我的水题狂魔的本质。 K题细节上卡了太久导致心态失衡(为了做出这题不管其他事情),没法帮队友摆脱D题困境,没办法想其他题。C题是个大水题都漏了(虽然没什么人发现)经验教训写在碎碎念中了...

2018-05-06 21:50:20 334

原创 【几何】回旋星空 广工校赛

虽然是几何题,但是集合的部分很少 题 意:在n个点中,有多少组三个点满足dis(a,b) = dis(b,c) 思 路:如果暴力枚举三个点,显然会超时。这时候,从题目条件出发。题目只要求两边相等的角的个数,那么考虑每个点作为角的顶点时,其他点与这个点的距离。所有相等的边中任取两条,C(n,2);#include<bits/stdc++.h>using na...

2018-04-03 22:12:32 106

原创 【数论】Aladdin and the Flying Carpet

我至今还不知道为什么for(int i=b;i<=sqrt(a);i++)的直接暴力会超时for(int i=1;i<b;i++)的委婉暴力不会算数基本定理:http://blog.csdn.net/u012860063/article/details/44784031 也是这道题的题解#include<bits/stdc++.h>usi...

2018-03-20 20:58:34 338 1

原创 【数论】Bi-shoe and Phi-shoe

开了数论的坑,目标是无压力写出铜牌+水平的数论题,更大的锅扔给队友吧 (ಥ﹏ಥ)本题要用到的欧拉函数:[http://www.cnblogs.com/linyujun/p/5194170.html]题 意:主要是给定n,找出欧拉函数大于等于n的最小的数。要求常数或者log时间。 解:首先,按欧拉函数值从小到大为第一次序,原值为第二次序排序。由于φ(n)不一定随n增大而增大,也...

2018-03-20 20:48:26 367

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除