自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(129)
  • 收藏
  • 关注

原创 论文笔记:Image Anaimation经典论文-运动关键点模型(Monkey-Net)

Monkey-Net(MOviNg KEYpoints)paper: https://arxiv.org/pdf/1812.08861, CVPR 2019code: https://github.com/AliaksandrSiarohin/monkey-net/tree/master该任务定义为给定一幅静态图像,和一个参考动作视频,让静态图像中物体按照参考图像中物体运动。该任务的核心可以分为解偶-重构两个阶段:在人脸Animation中,经典3D MM模型是经常被使用的模型,但其局限性非常明显:结合

2024-05-31 15:30:10 1240

原创 FRP远程连接

通过frp和跳板机完成局域网服务器访问。

2024-04-24 13:57:37 311

原创 数字人技术:相关论文汇总

Distangled face representation learning单位/会议/时间方法摘要MM 2022MegaPortraits: One-shot Megapixel Neural Head Avatars, paperTalking Face Generation单位/会议/时间方法摘要–Awesome-Talking-Face: https://github.com/JosephPai/Awesome-Talking-Face

2024-04-23 13:23:40 793

原创 数字人技术:VASA-1阅读笔记 & 代码汇总

论文地址:引入了5个约束条件,包括主要注视方向、头部到摄像头的距离、情绪偏移量、为了增加帧间平滑性,还增加了前K帧的语音特征和生成的运动特征,具体如下:θϕ)deKApreKXpre。

2024-04-23 11:42:36 1176

原创 学习Transformer:整体架构与实现

前言Transformer架构代码分析参考文献

2022-07-22 13:41:38 278

原创 Linux系统安装OpenCV

Linux系统安装OpenCV

2022-07-22 13:10:05 785 2

原创 Vim: 使用tags文件扩展YCM对C族语言第三方库的代码自动补全功能

在众多Vim编辑器的自动补全插件中,绝对是最好用的插件之一,但其配置过程往往令初学者望而却步。经过笔者多年折腾,至今基本达到满足日常使用水平。如果读者对YouCompleteMe这个插件不熟悉,建议首先参考笔者的博客Vim配置Python和C++常用插件。为更好地理解本文,建议读者首先阅读我的上一篇博客Vim扩展YCM对C族语言第三方库的语义分析功能。在这篇博客中,我们解决了YCM的语义分析出错问题,但对自动补全功能的提升有限。......

2022-07-22 13:05:44 1670

原创 Vim: 扩展YCM对C族语言第三方库的语义分析功能

在众多Vim编辑器的自动补全插件中,绝对是最好用的插件之一,但其配置过程往往令初学者望而却步。经过笔者多年折腾,至今基本达到满足日常使用水平。如果读者对YouCompleteMe这个插件不熟悉,建议首先参考笔者的博客Vim配置Python和C++常用插件。在使用Vim编辑C族语言代码时,如果额外使用了某些第三方库(如OpenCV),会发现YCM解析失效,找不到库文件,后序自动联想也无法使用。为此,本文结合YCM文档,首先分析一下为什么YCM在此情况下会失效,然后再给出对应的解决方案。.........

2022-07-22 13:04:04 1321

原创 算法: 回溯

回溯算法的本质是对树型或者图型结构进行一次深度优先搜索,是一种暴力搜索算法,因此其时间复杂度是较高的,为指数级别。从题目列表来看,几乎所有的回溯算法全部可以用一个树形图来帮助我们设计程序。只有深刻理解如何绘制树形图,才能设计出回溯算法,并做出相应的剪枝操作来提升算法的效率。代码随想录中总结了一套“回溯三部曲”较为实用,其中还提供了一个回溯算法的代码模板,学习前期可以根据这个模板感受回溯算法的表象,慢慢地再深刻理解其本质,具体内容见参考资料[1]。......

2022-06-15 17:49:06 210

原创 算法: 二叉树

二叉树是学习递归的优秀数据结构,对于二叉树问题的求解,关键在于对递归算法和不同二叉树的属性有深刻的理解。

2022-06-13 16:18:43 120

原创 C++: STL容器

C++: 标准模板库(Standard Template Library, STL)容器

2022-05-25 13:01:58 679

原创 Leetcode算法刷题记录

数组704. 二分查找27. 移除元素209. 长度最小的子数组54. 螺旋矩阵59. 螺旋矩阵 II链表203. 移除链表元素206. 反转链表19. 删除链表的倒数第 N 个结点141. 环形链表142. 环形链表 II

2022-05-23 18:04:49 229

原创 C++: 泛型编程

c++泛型编程

2022-05-17 17:36:37 124

原创 学习C++:类和对象

C++面向对象编程知识点回顾

2022-05-16 23:59:42 173

原创 学习C++:基础知识回顾

c++基础知识回顾

2022-05-15 18:58:17 297

原创 学习Transformer:自注意力与多头自注意力的原理及实现

自从Transformer[3]模型在NLP领域问世后,基于Transformer的深度学习模型性能逐渐在NLP和CV领域(Vision Transformer)取得了令人惊叹的提升。本文的主要目的是介绍经典Transformer模型和Vision Transformer的技术细节及基本原理,以方便读者在CV领域了解和使用Vision Transformer。......

2022-05-15 07:55:27 19614 8

原创 Linux服务器远程连接工具:Tmux

本文介绍了使用ssh连接服务器时意外中断的解决方案,笔者对比了screen和tmux两种工具,发现tmux更强大一些。相比于screen,tmux工具不仅可以将当前窗口会话与正在执行的任务分离(使任务在后台运行),而且具有更丰富的切屏和图形界面。因此,tmux工具是防止远程服务器连接意外中断的更佳选择。...

2022-03-18 13:04:48 2213

原创 计算机语言丛书学习:C\C++\JAVA\Python 基础-案例-应用

市面上的计算机语言类丛书层出不穷,各有特点。与现有书籍相比,本文介绍的计算机语言系列书籍具有案例驱动、基础详细、重视实战等特点,从入门到进阶均可参考,是值得考虑的系列丛书之一。

2022-03-17 21:52:27 1469

原创 计算机视觉数据集介绍:KITTI数据集

KITTI数据集是由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,利用组装的设备齐全的采集车辆对实际交通场景进行数据采集获得的公开数据集。该数据集包含丰富多样的传感器数据(有双目相机、64线激光雷达、GPS/IMU组合导航定位系统,基本满足对图像、点云和定位数据的需求)、大量的标定真值(包括检测2D和3D包围框、跟踪轨迹tracklet)和官方提供的一些开发工具等。...

2022-03-17 18:23:48 16575 1

原创 学习C++: VSCode配置C++开发环境

VSCode相比于Visual Studio来说更加轻量化,且可以跨平台使用,因此,本文通过文字结合大量截图一步步总结了如何在VSCode上配置C++开发环境。

2022-01-26 13:20:58 871

原创 机器学习基础:K近邻算法(Machine Learning Fundamentals: KNN)

k近邻法(k-nearest neighbor, k-NN)是1967年由Cover T和Hart P提出的一种基本分类与回归方法。本文主要总结了K临近算法的基本原理及优缺点等信息。

2021-03-24 23:16:21 566

原创 机器学习基础:期望最大化算法(Machine Learning Fundamentals: EM Algorithm)

EM算法和MLE算法的相同点在于,两者都需要知道确定的概率密度函数形式。若没有隐藏变量,则可以用MLE进行估计。若数据欠缺,或存在隐含变量,则无法使用直接使用MLE进行估计,因此需要使用EM算法。

2021-03-24 22:36:43 497

原创 计算机视觉基础:霍夫变换(Computer Vision Fundamentals: Hough Transform)

本文主要介绍了图像处理技术中的霍夫变换原理,同时介绍了OpenCV中实现的概率霍夫变换基本原理及流程。

2021-03-24 22:32:39 788

原创 计算机视觉基础:自适应阈值分割(Computer Vision Fundamentals: Adaptive Threshold Segmentation)

阈值分割方法虽然简单,但是如果场景简单,还是可以尝试使用的,因为其消耗的时间较少。同时,阈值分割也可以作为一个baseline来验证提出的新算法是否有效。本文主要介绍了OpenCV中介绍的两种自适应阈值分割算法,在实际工程中较常使用。

2021-03-24 22:26:44 4069 1

原创 机器学习基础:支持向量机(Machine Learning Fundamentals: Support Vector Machine, SVM)

支持向量机的核心思想很简单:在众多可行的分类的超平面中,选择一个超平面,使得两类样本到该超平面的间隔最大。本文通过图示和公式推导总结了支持向量机的基本原理,并介绍了支持向量机中用于非线性分类的核技术。

2021-03-24 22:07:20 809

原创 机器学习基础:极大似然估计(Machine Learning Fundamentals: Maximum Likelihood Estimation)

极大似然估计的核心思想是:利用已知数据来计算最可能获得这种数据分布的概率密度函数。

2021-03-24 21:57:54 320

原创 机器学习基础:主成分分析(Machine Learning Fundamentals: PCA)

PCA降维的核心思想在于: 将原始数据映射到低维度的正交基底上,映射之后的数据能最大限度的分开,即协方差矩阵要对角化。实际操作时发现:依赖矩阵的正交变换,将原始数据XXX的协方差矩阵对角化。对角化之后特征值对应的特征向量就是我们要求的新的基底。无论是PCA的核心思想还是推导过程其实都很简单,如果对PCA的细节不懂,通常是基础知识掌握的不够,同时对矩阵正交变换的几何意义了解不够。本文从基础到进阶,不断展开对PCA技术细节的总结。

2021-03-24 21:51:42 201

原创 机器学习基础:逻辑回归(Machine Learning Fundamentals: Logistic Regression)

简单来说, 逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。 注意,这里用的是“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当做概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘。

2021-03-24 21:40:43 174

原创 机器学习基础:朴素贝叶斯(Machine Learning Fundamentals: Naive Bayes)

朴素贝叶斯是一类假设特征之间具有统计独立性的有监督方法。因此,朴素贝叶斯的使用条件就是假设不同特征之间具有统计独立性。本文总结了朴素贝叶斯的基本原理。

2021-03-24 21:33:06 357

原创 学习vim: vim cheat sheet

前言关于VIM的快捷键,我发现最好的学习方式是把它们写下来放在眼前,忘了就看一眼,其实不用刻意去记,时间长了就记下来了。Vim Cheat Sheet以下是我查找的两个较好的VIM cheat sheet,供自己记忆使用,读者可以打印出来放在桌面上,或者将常用的命令摘抄在A4纸上,一点点累加新的命令。...

2020-11-23 12:46:54 745

原创 学习python:logging模块

Demoimport loggingimport syslogging.basicConfig(filename='./test.log', filemode='a', level=logging.INFO, format='%(asctime)s %(message)s', datefmt='%H:%M:%S')logger = logging.getLogger()logger.addHandler(logging.StreamHandler(sys.stdout))logger.inf

2020-10-27 23:12:57 122

原创 可视化技巧:分类问题中的决策面画法 (直观理解plt.contour的用法)

通过分类问题中决策面的绘制过程直观理解skimage中contour的用法。主要包括对 np.meshgrid 和plt.contour的直观理解。

2020-07-05 10:55:31 8055 1

原创 学习LaTex:常用符号总结

虽然现有资料中有很多关于latex中的常用符号和命令,但它们的排版和顺序不符合我的思路,有时查一个命令需要半天,因此这里重新总结一份。我常用的字典一样的资料就是文献[1],非常全面,但是很多命令八百年也用不上一次,因此有时找需要的信息如大海捞针。本文根据自己的需求,在文献[1]的基础上去掉了大多数不常用的命令,增加了少量自己常用但是文献[1]中没有的命令。

2020-07-04 10:22:36 2014

原创 学习python: 常见面试题总结

自己总结下python常见的面试题,这里没写答案,方便多次回顾。基础知识 深拷贝和浅拷贝的区别 List和Tuple的区别 解释python中的三元运算符 python是如何管理内存的 解释Python中的help()和dir()函数 当退出Python时,是否释放全部内存? Python中的字典是什么? 请解释使用*args和**kwargs的含义 请写一个Python逻辑,计算一个文件中的大写字母数量 什么是负索引? 如何以就地操作方式打乱一个列表的元素? Python区分

2020-06-14 19:04:00 165

原创 学术论文-结果描述常用表达

本文总结了英文学术论文中图、表格等一些常用的客观表达方式。

2020-05-11 23:16:38 626

原创 机器学习基础:Dice Loss(Machine Learning Fundamentals: Dice Loss)

为了验证dice作为loss function,是否会被分割物体面积的大小所影响,设计本实验。

2020-04-25 23:21:19 1228

原创 机器学习基础:评价指标(Machine Learning Fundamentals: Evaluation Metrics)

PrecisionRecallAccuracyF1F_1F1​ ScoreFβF_\betaFβ​ ScoreDicePR CurveROC Curve参考文献调和平均数的物理意义wikipedia Harmonic mean百度百科:调和平均数百度百科:F1F_1F1​分数CSDN:机器学习中的F1-scorewikipedia Tversky indexTve...

2020-04-25 23:16:58 244

原创 以一定概率执行某段代码(Python实现)

简介在数据扩增中,我们希望程序以一定概率执行某个扩增的行为,比如图像翻转; 在deep-medic中提到使用一定概率做某件事(忘了干啥了)。因此这种以一定概率做某件事在生活中还是很常用的,发现这种做法其实很简单,这里参考 Augmentor中使用的方法,将此类问题记录下来。内容这里粘贴了自己写的一个类,主要参考第22行即可。 15 class ElasticTransform(objec...

2020-04-25 23:15:21 2097

原创 机器学习基础:最大似然(Maximum Likelihood) 和最大后验估计 (Maximum A Posteriori Estimation)的区别

前言在研究SoftMax交叉熵损失函数(Cross Entropy Loss Function)的时候,一种方法是从概率的角度来解释softmax cross entropy loss function的物理意义[1]。我们再来回顾下分类器输出的Probability Map,如下:P(yi∣xi;W)=efyi∑jefjP(y_i \mid x_i; W) = \frac{e^{f_{y_...

2020-04-25 23:07:55 1975

原创 机器学习基础:核密度估计(Machine Learning Fundamentals: Kernel Density Estimation)

在概率密度估计过程中,如果我们队随机变量的分布是已知的,那么可以直接使用参数估计的方法进行估计,如最大似然估计方法。然而在实际情况中,随机变量的参数是未知的,因此需要进行非参数估计.核密度估计是非参数估计的一种方法,也就是大家经常听见的parzen 窗方法了.本文主要介绍 非参数估计的过程以及 parzen窗方法估计概率密度的过程....

2020-04-25 22:54:09 3539 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除