自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

机器学习杂货铺1号店

The chores of machine learning in my life

原创 人体动作捕捉与SMPL模型 (mocap and SMPL model)
原力计划

人体动作捕捉与SMPL模型 (mocap and SMPL model) FesianXu 2020.7.5 前言 笔者最近在做和motion capture动作捕捉相关的项目,学习了一些关于人体3D mesh模型的知识,其中以SMPL模型最为常见,笔者特在此进行笔记,希望对大家有...

2020-07-10 20:22:00 63 0

原创 数据,模型,算法共同决定深度学习模型效果
原力计划

数据,模型,算法共同决定深度学习模型效果 2020/4/20 FesianXu 在文献[1]中对few-shot learning进行了很好地总结,其中提到了一个比较有意思的观点,这里和大家分享下。先抛开few-shot learning的概念,我们先从几个基本的机器学习的概念进行分...

2020-04-20 21:25:01 213 0

原创 万字长文漫谈视频理解
原力计划

漫谈视频理解 2020/4/12 FesianXu 前言 AI算法已经渗入到了我们生活的方方面面,无论是购物推荐,广告推送,搜索引擎还是多媒体影音娱乐,都有AI算法的影子。作为多媒体中重要的信息载体,视频的地位可以说是数一数二的,然而目前对于AI算法在视频上的应用还不够成熟,理解视频...

2020-04-16 09:37:52 1906 9

原创 【多视角立体视觉系列】 几何变换的层次——投影变换,仿射变换,度量变换和欧几里德变换

【多视角立体视觉系列】 几何变换的层次——投影变换,仿射变换,度量变换和欧几里德变换 20200226 FesianXu 前言 几何变换非常常见,在计算机视觉和图形学上更是如此,而这里指的几何一般是由点,线,面等几何元素组成的1,2维或3维图形。几何变换能够实现不同空间几何元素的对应...

2020-02-27 12:04:47 1549 0

原创 【多视角立体视觉系列】 conic圆锥线和quadric二次曲锥面的定义和应用

【多视角立体视觉系列】 conic圆锥线和quadric二次曲锥面的定义和应用 20200226 FesianXu 前言 之前我们讨论过一些几何元素,比如点线面等,在本文中,我们将谈到称之为圆锥线和二次曲锥面的几何元素,这种类型的曲线对于讨论计算机视觉中投影是非常有效的,同时也是定义...

2020-02-26 13:56:03 266 0

原创 C语言中去除不必要的内存引用可以有效地提高性能

在C语言中,我们经常会存在对某个内存地址进行引用的操作,也就是如下列代码所示的,对指针进行取内容: int vars[10]; int var = *(vars+3); //这里就是对数组vars的第三个元素进行引用 这种内存引用操作对应的汇编代码通常如: mov (%rax), %rdx; ...

2020-02-02 22:24:12 100 0

原创 c语言中内循环和外循环的位置可能产生性能上的区别

在图像处理相关的代码中,我们经常有类似于以下的代码,去遍历多维数组(张量)的每一个元素: #define LENGTH 10000 void proc(){ uint8 datas[LENGTH][LENGTH]; int i, j; long long sum = 0; for (i =...

2020-02-01 00:01:49 606 0

翻译 一文理解Ranking Loss/Contrastive Loss/Margin Loss/Triplet Loss/Hinge Loss

一文理解Ranking Loss/Contrastive Loss/Margin Loss/Triplet Loss/Hinge Loss 翻译自FesianXu, 2020/1/13, 原文链接 https://gombru.github.io/2019/04/03/ranking_...

2020-01-15 20:56:59 3862 2

原创 讨论物体的表面深度对相机成像的影响

讨论物体的表面深度对相机成像的影响 2019.11.02 FesianXu 前言 对于不同的物体来说,其表面纹理,或者凸出凹陷各有不同,这些对于相机成像而言都会造成影响,笔者在这篇博文中尝试对此进行讨论。如有谬误,请联系指正。转载请注明出处。 ∇\nabla∇ 联系方式: e-ma...

2019-11-02 11:29:25 150 0

原创 图像校正(Image Rectification)——使得在对极线上寻找对应点更加容易

图像校正——使得在对极线上寻找对应点更加容易 2019/10/27 FesianXu 文章目录@[toc]前言为什么我们需要图像矫正图像矫正Reference 前言 我们在[1]中曾经谈到了如何在对极线上去寻找对应点,这样会使得算法更鲁棒,而且速度更快。在本文中,我们将会继续介绍一种...

2019-10-28 09:44:00 1393 0

原创 几何变换——关于透视变换和仿射变换以及齐次坐标系的讨论

几何变换——关于透视变换和仿射变换以及齐次坐标系的讨论 2019/10/26 FesianXu 前言 在本文首先介绍了引入齐次坐标系的必要性,随后介绍了在几何变换中常见的投射变换和仿射变换,这俩种变换在计算机视觉问题中,包括在相机成像过程中都是很基础并且重要的内容。 如有谬误,请联系...

2019-10-26 14:51:30 389 0

原创 立体视觉中的对极几何——如何更好更快地寻找对应点

立体视觉中的对极几何——如何更好更快地寻找对应点 2019.10.21 FesianXu 文章目录@[toc]前言什么是立体视觉对极几何对极约束本征矩阵去掉归一化坐标系的限制,引入基础矩阵Reference 前言 在立体视觉中,我们通过多个摄像机的相互配合,可以获得关于现实生活中物体...

2019-10-21 16:08:24 439 0

原创 《Geometric Deep Learning学习笔记》第三篇,GCN的空间域理解,Message Passing以及其含义

GCN的空间域理解,Message Passing以及其含义 5/20, '19 FesianXu 前言 在上一篇文章中[1],我们介绍了Graph Convolution Network的推导以及背后的思路等,但是,其实我们会发现,在傅立叶域上定义出来的GCN操作,其实也可以在空间...

2019-05-19 23:10:07 3087 11

原创 《Geometric Deep Learning学习笔记》第二篇, 在Graph上定义卷积操作,图卷积网络

前言 我们曾在[1]中探讨了欧几里德结构数据(如图像,音视频,文本等)和非欧几里德结构数据(如Graph和Manifold等)之间的不同点,在本文中,我们探讨如何在非欧几里德数据,特别是Graph数据上定义出卷积操作,以便于实现深度神经学习。 如有谬误,请联系指正。转载请注明出处。 联系方式: e...

2019-05-19 21:55:04 1379 0

原创 【动作识别相关,第一篇】skeleton骨骼点数据类型介绍

前言 本文主要是对多视角动作识别问题以及基于骨骼点(Skeleton)模态数据的动作识别问题的一个简单的综述性文章,本文提到的方法,大部分是基于骨骼点数据进行的,为了读者可以有个更好地理解,本文将会从数据的获得开始谈起。如有谬误,请联系指出,如需转载,请注明出处,谢谢。 ∇\nabla∇联系方式:...

2019-02-24 12:14:23 2450 5

原创 [临时笔记,持续更新] 深度学习debug沉思录第二集

前言 在之前文章[1]中,我们曾经讨论过在深度学习实践过程中可能遇到的一些bug或者问题,总共讨论了20个问题。在本文中,我们将继续讨论与深度学习有关的bug和问题,其中很多是关于一些超参数的实践中的调优问题。本文将持续更新。需要强调的是,本文的很多单纯只是经验,在尽可能列出参考文献的同时却并无严...

2019-02-15 11:48:58 251 1

翻译 什么是DevOps

什么是DevOps 译者:FesianXu 2020/6/17 @ Tencent internship, 原文: https://qr.ae/pNKYl6 译者的话 DevOps是Develop+Operations的简写,意思是开发运营,译者最近在了解DevOps, CI/CD这些概念,...

2020-06-17 20:12:34 58 0

原创 Object Detection中的mAP
原力计划

前言 指标很重要,合适的指标更是重中之重。mean Average Precision, mAP是常见的评估机器学习模型性能的指标,其在物体检测任务中也有着广泛地应用,是诸多Object Detection任务的主要评估指标,本文总结一些关于mAP的理解。如有谬误,请联系指出,本文参考[1,2]。...

2020-05-30 18:02:17 71 0

原创 基于匹配点集对单应性矩阵进行估计
原力计划

基于匹配点集对单应性矩阵进行估计 2020/4/28 FesianXu 前言 在立体视觉中,对单应性矩阵进行估计是一个很重要的任务,我们在之前的博文[1,2,3]中的讨论中都或多或少地涉及到了单应性矩阵,我们知道它是在投影变换中保持共线性的一种性质。在本文中,我们将讨论如何通过匹配点...

2020-05-04 11:42:48 604 0

原创 《临时笔记》caffe2使用记录

本文作为临时笔记,记录笔者在使用caffe2时候的一些问题和解决方法,有空再进行详细整理。 在caffe2中对视频的单帧进行了零均值标准化处理,也就是如式子(1.1)所示: x^=x−meanstd(1.1) \hat{x} = \dfrac{x-\mathrm{mean}}{\mathrm{s...

2020-04-30 16:04:46 84 0

翻译 数据并行和模型并行的区别

此文翻译自[1],[1]对数据并行和模型并行进行了很好地区分,因此这里推荐给大家。 介绍 现在深度学习模型的参数量已经变得越来越多了,数据集的尺寸也随之疯狂地增长。为了在一个巨大的数据集上训练一个复杂的深度学习模型,我们不得不使用多节点的并行方式,否则我们永远不可能达到这个目的。这里谈到的并行,...

2020-04-28 13:15:04 255 0

原创 《临时笔记》 编程生涯中的傻傻的bug问题

为了纪念在编程生涯中出现的傻傻的bug,特此做此笔记,以兹参考。 torchvision中的ToPILImage()函数 torchvision.transforms.TOPILImage()函数用于将tensor形式的图片转化为用PIL图片格式,以便于后续的处理,比如crop,resize等等...

2020-04-27 17:48:33 56 0

原创 在pytorch中停止梯度流的若干办法,避免不必要模块的参数更新
原力计划

在pytorch中停止梯度流的若干办法,避免不必要模块的参数更新 2020/4/11 FesianXu 前言 在现在的深度模型软件框架中,如TensorFlow和PyTorch等等,都是实现了自动求导机制的。在深度学习中,有时候我们需要对某些模块的梯度流进行精确地控制,包括是否允许某个模块的...

2020-04-12 11:10:31 588 2

原创 用“位操作”取代“取模操作”判断奇数偶数

在刷题过程中,我们经常会遇到需要判断某个整数是奇数还是偶数的情况,这个时候,我们可能会采取取模的操作,直接判断,如: num % 2 == 0; num % 2 == 1; 然而,取模操作是非常慢的(按照速度来说,位移操作>=加减法>>乘除法,取模,具体见文末的备注),因此我们...

2020-03-31 18:36:02 177 0

原创 [LeetCode刷题笔记] C++ unordered_set常用操作

在[1]对常用的STL容器进行了概览,笔者在刷题过程中经常需要查询一些STL容器的函数,实为不便,因此在此对STL容器中常用的操作进行笔记。 std::unordered_set<key>是一种STL提供的无序集合的类,集合的特点就是其中没有任何重复的元素,这个特点非常适合用于纪录某...

2020-02-23 21:28:14 318 0

原创 [LeetCode刷题笔记] C++ unordered_map常用操作

在[1]对常用的STL容器进行了概览,笔者在刷题过程中经常需要查询一些STL容器的函数,实为不便,因此在此对STL容器中常用的操作进行笔记。 std::unordered_map<key, T> 是一种关联性的容器,类似于Python中的dict字典,其特点就是可以通过键值key在...

2020-02-23 20:39:46 288 0

原创 [LeetCode刷题笔记] C++ priority_queue常用操作

在[1]对常用的STL容器进行了概览,笔者在刷题过程中经常需要查询一些STL容器的函数,实为不便,因此在此对STL容器中常用的操作进行笔记。 std::priority_queue<T>定义于头文件<queue>中,是所谓的优先队列,一般的队列,如同[2]中所示,是先进先...

2020-02-23 11:12:30 149 0

原创 [LeetCode刷题笔记] C++ stack常用操作

在[1]对常用的STL容器进行了概览,笔者在刷题过程中经常需要查询一些STL容器的函数,实为不便,因此在此对STL容器中常用的操作进行笔记。 std::stack<T>是STL库中实现了后进先出的数据栈的数据结构,同样是属于对std::vector<T>进行了某些操作限...

2020-02-23 01:35:24 191 0

原创 [LeetCode刷题笔记] C++ queue常用操作

在[1]对常用的STL容器进行了概览,笔者在刷题过程中经常需要查询一些STL容器的函数,实为不便,因此在此对STL容器中常用的操作进行笔记。 std::queue<T>是STL库中的实现队列的类,队列是一种先入先出(First-In-First-Out, FIFO)的数据结构,其可...

2020-02-23 01:22:12 130 0

原创 [LeetCode刷题笔记] C++ vector常用操作

在[1]对常用的STL容器进行了概览,笔者在刷题过程中经常需要查询一些STL容器的函数,实为不便,因此在此对STL容器中常用的操作进行笔记。 std::vector是一种线性数组,每个元素的数据类型都相同,不过和一般的静态的数组不同的是,其允许通过插入元素,删除元素实现所谓的动态数组,是常用的数...

2020-02-23 01:05:29 223 0

原创 C++ STL标准库容器 概览

前言 本文对C++中的STL标准库容器进行概览,作为笔者平时的学习笔记,以兹备忘。同时,本文作为一个目录,接下来对常用容器,比如vector,map等的 具体介绍的博文将会由本文进行索引。 C++的标准容器库中提供了一系列的容器模版,可以作为日常工作生产中的数据结构使用,以此减少了程序员很多去造...

2020-02-05 23:07:49 78 0

原创 [leetcode刷题笔记] 反转链表

题目地址: https://leetcode-cn.com/problems/reverse-linked-list/submissions/ 题目内容: 反转一个单链表。 示例: 输入: 1->2->3->4->5->NULL 输出: 5->4->3-...

2020-02-05 21:54:26 69 0

原创 [leetcode刷题笔记] 杨辉三角 I&II

题目地址: https://leetcode-cn.com/problems/pascals-triangle/ 杨辉三角 I https://leetcode-cn.com/problems/pascals-triangle-ii/ 杨辉三角 II 题目内容: 在杨辉三角中,每个数是他的...

2020-02-05 16:16:34 73 0

原创 [leetcode刷题笔记] 两两交换链表中的节点

题目地址: https://leetcode-cn.com/problems/swap-nodes-in-pairs/ 题目内容: 给定一个链表,两两交换其中相邻的节点,并返回交换后的链表。你不能只是单纯的改变节点内部的值,而是需要实际的进行节点交换。 示例: 给定 1->2->3-...

2020-02-05 00:29:09 78 0

原创 [leetcode刷题笔记] 反转字符串

题目地址: https://leetcode-cn.com/problems/reverse-string/ 题目内容: 编写一个函数,其作用是将输入的字符串反转过来。输入字符串以字符数组 char[] 的形式给出。 不要给另外的数组分配额外的空间,你必须原地修改输入数组、使用 O(1) 的额外空...

2020-02-04 23:29:23 51 0

原创 c语言运行时出现segment fault的原因

segment fault段错误是在编程报错中经常出现的,特别是在c语言编程中,尤其常见,其原因本质上上是访问了非法(不属于这个程序)的内存地址空间,具体来说有以下几种情况: 局部变量定义中,使用了过大的局部变量,大于了系统给之的栈(stack)的大小,因此报错。比如以下代码在linux环境下,...

2020-01-31 21:38:04 320 0

原创 参数和非参数模型——当我谈到参数我在说些什么

参数和非参数模型——当我谈到参数我在说些什么 FesianXu 2020/1/12 前言 参数模型和非参数模型是我们在机器学习中经常听到的术语,但是其中的“参数”却和我们通常理解的参数有所不同,本文尝试对此进行解释。如有谬误,请联系指出,谢谢。 ∇\nabla∇ 联系方式: e-mail:...

2020-01-12 23:58:58 210 0

原创 在vs code上进行远程深度学习开发环境简易搭建

远程深度学习环境的搭建,可以采用pycharm,其是一个IDE,可以采用远程解释器连接到远程的服务器进行python代码的运行,debug和同步等,但是pycharm是一个商业软件,而且其体量较大,打开速度慢,因此更为轻量级的解决方案可以采用vs code(以下简称vsc)。 环境 ubuntu...

2020-01-07 12:51:28 681 0

原创 《临时笔记》一些深度学习中的英文术语的纪录

jitter 抖动(jitter)[1]在机器学习中是一种有效的数据增广(data augmentation)手段,其本质是在训练模型过程中,在训练数据中人工叠加的一些噪声。在训练中添加抖动可以有效地工作,提高性能,其原因在于我们通过神经网络学习得到的假设函数(hypothesis)通常是平滑的,...

2020-01-07 12:28:01 109 0

原创 论相机中心投影中,相机中心的作用

论相机中心投影中,相机中心的作用 2019/12/3 FesianXu 前言 在中心投影中,相机中心作为聚集光线的理想中心,其具有核心的作用,本文参考[1]中的讨论,加上一些见解,作为笔者学习过程中的笔记。 如有谬误,请联系指正。转载请注明出处。 ∇\nabla∇ 联系方式: e-m...

2019-12-03 16:06:18 166 0

提示
确定要删除当前文章?
取消 删除