- 博客(5)
- 收藏
- 关注
原创 STN的理解
网络结构网络分为三个部分:Localisation net、Grid generator以及Sampler输入为feature map UUU,输出为feature map VVV。Localisation net以UUU为输入,经过卷积层或者全链接层输出仿射参数θ∈(2,3)\theta \in (2,3)θ∈(2,3)假设θ=[θ11θ12θ13θ21θ22θ23]\theta=\begin{bmatrix}\theta_{11}&\theta_{12}&\theta_{1.
2020-07-12 16:41:40 1235 2
原创 A Variational U-Net for Conditional Appearance and Shape Generation
该方法能够生成不同的姿态的人物图像以及改变人物的外观。而且这个模型能够在不改变shape的情况下从appearance distribution 中进行采样。1 Approach记xxx为dataset XXX中的一张图片,我们想要理解xxx中的object是如何被其shape yyy和appearance zzz所影响的。因此图像生成器可以被表示为最大化后验概率(极大后验估计:给定xxx,哪种yyy和zzz可能发生)arg max p(x∣y,z)arg\ max\ p(x|y
2020-06-03 20:23:41 397
原创 深度学习的基本概念
1绪论 基本的深度学习相当于函数逼近问题,即函数或曲面的拟合 ,所不同的是,这里用作基函数的是非线性的神经网络函数,而原来数学中的用的则是多项式、三角不等式等。 由于神经网络的非线性和复杂性,它有更强的表达能力,即能够从给定的神经网络函数族中可能找到对特定数据集拟合得更好的神经网络。这里既涉及设计合适的神经网络类型,也涉及从该类型中的神经网络中找出好的(即拟合误差小的)特定神经网络的方法。后者正是数学中最优化分支所研究的问题。从数学角度来说,目前深度学习中所用的优化算法还是属于比较简单的梯度下降
2020-06-02 18:59:50 3205
原创 线性模型
线性模型是机器学习中应用最广泛的模型,指通过样本特征的线性组合来进行预测的模型。给定一个D维样本x=[x1,...,xD]T\pmb{x}=[x_1,...,x_D]^Txxx=[x1,...,xD]T ,其线下你给组合函数为:f(x;w)=w1x1+w2x2+...+wDxD+b=wTx+bf(x;w)=w_1x_1+w_2x_2+...+w_Dx_D+b=\pmb{w^Tx}+bf(x;w)=w1x1+w2x2+...+wDxD+b=wTxwTxwTx+b 其中w=[w1,.
2020-05-30 18:43:45 436
原创 Controllable Person Image Synthesis with Attribute-Decomposed GAN
1. Idea可控性的图像生成提出了具有两个独立pathways的生成器。其中一个pathway是用于pose encoding,另一个用于decomposed component encoding。对于后者首先使用预训练的human parser从source person image 中自动地分离出component attributes(得到的是semantic layouts)。得到的component layouts之后通过multi-branch embeddings送入global te
2020-05-28 22:21:21 1635
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人