Hym_eric-CSDN博客

原创 2021_Image-to-image Translation via Hierarchical Style Disentanglement_CVPR

概要本文是一片针对人脸进行属性编辑的论文，针对从CycleGAN提出后，图像翻译面临的最大的两个问题就是扩展性（同时处理多种篡改）和多样性（生成不同的结果），然而，一直没有一个很好的方法，可以兼顾扩展性和多样性的同时，又能使得这种篡改满足预期。例如，对于人脸属性篡改任务，我们想要给人脸加上刘海，可是却改变了发色或是背景，再例如，我们想要给人脸加上眼睛，结果竟然性别和年龄也改变了。下面是最新模型StarGANv2的结果：针对以往方法不能单独控制独立的属性的缺点，设计了层级结构模型HiSD，同.

2021-06-23 14:16:33 1705

原创 2019_VideoBERT-A Joint Model for Video and Language Representation Learning_ICCV

模型：看上出很简单，就是利用了bert的模型，输入输出不仅仅是文本，将视频和文本相结合一起自监督训练，不仅可以得到单文本或者单视频内部的关系，还可以得到文本和视频的对应关系。文中强调了学习的是一种high-level的语义，和之前的视频表征学习不同，使用了三个现成的方法，ASR语音转文字（Youtube自带的一个API接口）、vector quantization（VQ）将视频转化为visual words和bert模型。主要贡献就是提出了这么一种自监督训练视频特征的方法。这里的输入前面的CLS

2021-06-23 09:14:34 496

原创 2019_Polysemous Visual-Semantic Embedding for Cross-Modal Retrieval_CVPR

Motivation以往的跨模态检索工作都是一对一映射关系，对于语义不明或者多语义的文本和视觉图像/视频效果不好，下图是一个例子，文本中表达的含义和视频中表达的含义非常模糊的，再比如一句话只是描述了图像中某一个区域，作者提出使用一对多的方法，将单例（文本或者图像视频等）映射到多级特征中，分成K个表示，就是一对多的关系建模，并且通过local和global的方式去构建模型，对损失函数也做了相应修改，达到了更好的结果，并且提出了一种具有ambiguous特点的数据集MRW，这种数据集是：视频中是对一句话文本

2021-06-23 09:07:48 583

原创 2020_Deep Image Compositing_arXiv

这篇工作做的是图像合成，是有监督的方式整体有三个网络，一个根据显著性物体的网络先做分割，之后输入到refinement 网络进行优化mask，之后利用双支路编解码模型得到目标图像。并提出了一种针对双流模型合成任务的triplet数据对增强方法，先在简单数据集上训练，之后根据简单数据fg和随机复杂背景得到更难训练的样本形成一种self-taught的训练模式。主要的创新点在于提出的数据增强策略，（其实就是用数据提升效果），展示的效果很多，其他并没有特别突出的地方基本都是已有的方法借...

2021-06-23 09:01:37 574

原创 2019_Dual Encoding for Zero-Example Video Retrieval_CVPR

Motivation现存的视频检索的工作都是concept based的方法，从视频和文本中寻找各自对应的概念，在现实场景中比较难以使用，作者提出concept free方法，加入多种特征的双塔模型，简单高效。Contribution提出一个多级的编码方式，映射到同一空间渐进式地学习局部、全局和时序的特征不错的效果Method如图，视频和文本的模型差不多，对于视频先用预训练好的模型提取特征，通过平均池化得到全局特征，通过双向GRU得到时序特征，通过双向G...

2021-06-23 08:51:44 448

原创 2006_Color Harmonization_SIGGRAPH

这是一篇关于色彩和谐化的工作，可以根据图片的HSV空间中H色相的值进行改变颜色，使得原图更加美观。文中使用色相环，预定义了8种模板模板中的中心位置说的是扇形区域的中间那条线是在哪个地方（顺时针偏移），默认垂直向上的是0，eg 0.25 则是说的中心线在正东方向。而宽度是不变的，也就是灰色的扇形区域的大小是不变的，变得就只是中心线的位置，相当于在绕着中心点旋转。这个是相当于损失函数，里面的||*||代表了弧长，意思是让像素的色相值尽可能接近模板本身，算法思路是，先固定模板，然.

2021-06-23 08:43:24 425

转载【论文CVPR2016】NetVLAD: CNN architecture for weakly supervised place recognition-转载

原文：http://www.liuxiao.org/2019/02/%E8%AE%BA%E6%96%87%E7%AC%94%E8%AE%B0%EF%BC%9Anetvlad-cnn-architecture-for-weakly-supervised-place-recognition/NetVLAD1是一个较早的使用 CNN 来进行图像检索或者视频检索的工作，后续在此工作的基础上陆续出了很多...

2020-02-12 11:33:37 1200 1

原创阿里云centos python升级后的坑

python升级之后显示缺少_ssl，发现解决方案很麻烦，于是就像安装anaconda，但是当我bash Anaconda3-5.0.1-Linux-x86_64.sh的shihou中途报错，说没有bzip2，所以查找办法，可以用yum安装，但是yum基于python2.7，又找办法，可以修改两处1、修改yum配置文件，将python版本指向以前的旧版本 # vi /usr/b...

2018-12-20 19:33:27 587

原创【No.1】史上最清楚的numpy shape和axis讲解

很久之前就学习了numpy，但是最近在使用的过程中，突然蒙蔽了，以前就是对于二位、三维数据的记忆，如果忘记了，测试一下就知道了，但是内心无法接受，所以决定再仔细的研究一番，经过很多资料的学习终于让我剔骨灌顶，希望可以帮到路过的人，这里均采用实例讲解。一、shape比如：a=np.array([[[1,2,3],[2,3,4]],[[2,3,4],[1,2,1]]])首先要知道在nump...

2018-12-06 21:35:22 1124 2

原创 Python中的X[:,0]、X[:,1]、X[:,:,0]、X[:,:,1]、X[:,m:n]、X[:,:,m:n]和X[: : -1]

对于X[:,0];是取二维数组中第一维的所有数据对于X[:,1]是取二维数组中第二维的所有数据对于X[:,m:n]是取二维数组中第m维到第n-1维的所有数据对于X[:,:,0]是取三维矩阵中第一维的所有数据对于X[:,:,1]是取三维矩阵中第二维的所有数据对于X[:,:,m:n]是取三维矩阵中第m维到第n-1维的所有数据这样的讲解可能还是有点...

2018-12-04 18:07:37 7849

原创 Ubantu14.04 自己工作目录安装cuda10和cuDNN v7.4.1 (Nov 8, 2018), for CUDA 10.0

首先到cuda官网下载cuda10：1、下载并安装CUDA10.0 https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1404&target_type=runfilelocal 对...

2018-12-02 10:59:53 1949

转载 tensorfow中的Dataset

转：https://www.jianshu.com/p/aeb54ed224b31 Dataset API的导入在TensorFlow 1.3中，Dataset API是放在contrib包中的：tf.contrib.data.Dataset在TensorFlow 1.4中，Dataset API已经从contrib包中移除，变成了核心API的一员：tf.data.Dataset下...

2018-11-18 15:49:44 487

转载 tensorflow：tf.GraphKeys

转：https://blog.csdn.net/hustqb/article/details/80398934GraphKeystf.GraphKeys包含所有graph collection中的标准集合名，有点像Python里的build-in fuction。首先要了解graph collection是什么。graph collection在官方教程——图和会话中，介绍什么...

2018-11-18 15:22:20 401

转载 tensorflow教程：collection，regularizer

转：https://www.cnblogs.com/linyuanzhou/p/6923607.htmltf.add_to_collection：把变量放入一个集合，把很多变量变成一个列表tf.get_collection：从一个集合中取出全部变量，是一个列表tf.add_n：把一个列表的东西都依次加起来例如：[python] import tensorflow as...

2018-11-18 15:13:01 393

原创 Tensorflow 跨平台部署问题系列

笔记 - TensorFlow模型的跨平台部署（一）https://zhuanlan.zhihu.com/p/40140538笔记 - TensorFlow模型的跨平台部署（二）https://zhuanlan.zhihu.com/p/40226973笔记 - TensorFlow模型的跨平台部署（三）https://zhuanlan.zhihu.com/p/40261328...

2018-11-17 22:03:12 568

转载 TensorFlow模型格式简介

参考：https://zhuanlan.zhihu.com/p/34471266简介TensorFlow的模型格式有很多种，针对不同场景可以使用不同的格式，只要符合规范的模型都可以轻易部署到在线服务或移动设备上，这里简单列举一下。Checkpoint：用于保存模型的权重，主要用于模型训练过程中参数的备份和模型训练热启动。 GraphDef：用于保存模型的Graph，不包含模型权重，...

2018-11-17 18:37:08 1640

转载 Tensorflow-Estimator-自定义估算器

转载：https://www.jianshu.com/p/5495f87107e7这篇文章介绍自定义一个估算器（分类器）Estimator的完整流程。请先参照鸢尾花iris案例并完成练习。自定义Custom Estimator和预制Pre-made Estimator在上面iris的案例中我们使用了tensorflow里面自带的深度神经网络分类器tf.estimator.DNNCla...

2018-11-17 16:28:25 1220 1

转载 Learn Python 3：dict

【转载】一、什么是字典Python中，字典（dict）,是一系列放在{}的键值对（key-value）。可以使用键来访问对应的值，与键对应的值可以是数字、字符串、列表、字典，字典具有极快的查找速度。下边是一个与手机信息相关的dict：{'os': 'Android', 'soc': 'Qualcomm', 'screen': 'Samsung'}除了直接通过{}来创建字典，还可...

2018-11-17 15:32:50 373

转载 pandas.read_csv参数详解

转载：http://www.cnblogs.com/datablog/p/6127000.html读取CSV（逗号分割）文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见：http://pandas.pydata.org/pandas-docs/stable/io.html参数：filepath_or_buffer : str，pathlib。str, path...

2018-11-17 15:14:47 342

转载 TensorFlow全新的数据读取方式：Dataset API入门教程

zhuan知乎： https://zhuanlan.zhihu.com/p/30751039 发布于 2017-11-05Dataset API是TensorFlow 1.3版本中引入的一个新的模块，主要服务于数据读取，构建输入数据的pipeline。此前，在TensorFlow中读取数据一般有两种方法：使用placeholder读内存中的数据使用queue读硬盘中的数据（关于这种...

2018-11-17 15:02:52 528

转载 tensorflow中使用tf.ConfigProto()配置Session运行参数&&GPU设备指定

原文：https://blog.csdn.net/dcrmg/article/details/79091941tf.ConfigProto()函数用在创建session的时候，用来对session进行参数配置： config = tf.ConfigProto(allow_soft_placement=True, allow_soft_placement=True)config...

2018-11-14 09:01:00 616

原创 DropBlock：谷歌提出卷积正则化方法，CNN中的正则化

arXiv新上一篇被NIPS2018会议接收的论文《DropBlock: A regularization method for convolutional networks》，作者为来自谷歌大脑的研究人员，提出了一种专门针对卷积层正则化的方法，方法非常简单，有效改进了CNN的各种任务，非常值得一读！文中指出，在目前的神经网络训练的广泛实践中，全连接网络加DropOut是一种有效的正则化方法，...

2018-11-13 18:47:01 2842

原创深度学习之anaconda遇到的坑：python已停止工作

今天上午昨晚人脸识别的实验之后，下午准备做另一个实验，但是打开jupyter notebook 之后运行import一系列包的时候总是出错，说python已经停止工作，我用了大概三个小时解决这个问题。。。。真的坑人 1、打开Andaconda Prompt首先更新jupyterconda upgrade juyter2、更新notebookconda uograde noteb...

2018-10-16 15:19:22 20822 4

转载搞清楚MongoDB是什么？

最近在学python爬虫中遇到了MongoDB，所以就记录下这篇博客以供学习。【转载而来】一、概述1.MongoDB是什么？用一句话总结MongoDB是一款为web应用程序和互联网基础设施设计的数据库管理系统。没错MongoDB就是数据库，是NoSQL类型的数据库2.为什么要使用MongoDB？（1）MongoDB提出的是文档、集合的概念，使用BSON（类JSON）作为其数据模...

2018-10-11 15:42:02 639

转载 Python关于%matplotlib inline

在github代码中经常会看到这样的代码：import numpyimport matplotlib.pyplot as pltfrom pandas import read_csvimport mathfrom keras.models import Sequentialfrom keras.layers import Densefrom keras.layers import...

2018-10-09 19:17:14 2091

原创本科普通一本软件工程专业保研（双一流）软件工程/计算机经验分享

本人基本情况：Offer：浙江大学软件工程、南京大学软件工程、湖南大学计算机科学与技术、中南大学软件工程、西安交通大学计科（西交学校比较有意思，后面继续看）、深圳大学软工、北邮（拒绝了）、武汉理工大学计科（建议多给自己留后路，最后选择浙大软工顺利录取）专业21人（英语+软件工程专业，专业比较特殊），三年成绩第一，获得国家奖学金、美赛M奖、数学竞赛国三、挑战杯、创青春、蓝桥杯等省奖；（一般般）...

2018-09-28 14:16:46 9530 5

原创安卓和IOS读取相册等辅助功能插件推荐【Native+Toolkit】

因为之前项目的需要，自己找了调用安卓相册和拍照的插件，只后又要ios的读取相册和拍照的功能，我记得之前截图是用的网上的插件，读取相册是自己做的AS aar，但是只后发现了一款叫做Native+Toolkit+1.2的插件，在ios和android上都能用，从网上找了一个截图，可以看下，http://www.manew.com/thread-99636-1-1.html 这个网页应该可以获取...

2018-08-10 20:54:21 1346 1

原创 unity2017.3.0f和AS3.1 多manifest清单文件和jar包探索【一】

因为最近有一个项目需要用AS制作arr和jar包，给unity调用，但是用到了多个，还有网上的插件也有清单文件，这就引起了冲突，查看了网上很多的资料和博客，都没有很好的解决方法，我也是在尝试探索，所以写下这篇文章，以供记忆和学习。如何打arr包给Unity用：AndroidStudio导出aar包给Unity（最详细）如何使用build导出jar、manifest、res文件给Uni...

2018-08-08 21:52:32 603

原创 Unity2017.3.0f和Android Studio3.1通信

首先，具体的打包流程可以参考这个，已经是很新的了，而且写的很好：Androidstudio3.1和unity互相调用（支持原创），照做应该没问题，如果遇到问题或者坑可以接着看，可能有帮助。其次，说一下自己遇到的坑：1、遇到了SDK版本不一样的问题，解决方法在：https://blog.csdn.net/qq_28775437/article/details/78605691?lo...

2018-08-01 21:22:20 683

原创【人脸识别基础1】opencv3.4+VS2013+Dlib 19.1 环境配置探索

想自己设计并训练识别模型，所以开启了人脸识别学习之旅，首先是环境的搭建，主要参考了下面几篇博客。1、 https://blog.csdn.net/nickcry/article/details/79148772 （opencv）2、 https://blog.csdn.net/sai_miracle/article/details/79262172 （opencv）3、 https://blog....

2018-07-09 16:55:04 593

原创安卓串口开发--jni文件、.so文件环境搭建（详细步骤）

窜口通信需要用到jni，对于jni开发，我上网看了很多教程，五花八门，很多都不成功，所以自己来写一份自己做成功的，详细的，以供以后忘记的我学习和大家一起学习！1、新建项目MySerialPort，确保自己的NDK已经配置完成（不会的百度教程），这里在gradle.properties里面加一句话android.useDeprecatedNdk=true可能有的朋友运行之后有问题，会有错误提示让你换...

2018-05-06 23:08:56 1607

原创关于Unity项目作为module导入新版AS3.0系列和3.1.2 的一些坑（包含详细步骤）

对的，你没看错，新版本的AS总是有那么多坑，等着我们developer去填补，一起学习。我一开始用的是AS3.0.1版本，这个版本import module之后，在一切工作之后总是会出现不能删除build文件夹下的问题，但是我在室友的电脑上安装之后就没有问题，不知道怎么回事，毫无违和感的bug，我之后又重新卸载安装了AS3.0.1，设置SDK都重新安装了，但是还是之前的问题，不能有权限读写buil...

2018-05-04 10:12:54 1181

原创 AS中测试依赖和appcompat版本问题解决

有时候当你新建一个AS项目的时候，clean之后可能会报错，这是因为测试依赖的版本和当前的版本不一致，之前是：clean会报错，但是修改为：就不会报错了，也可以修改appcompat为27.1.0和TestImplementation为1.0.2和3.0.2,也可以。...

2018-05-03 17:54:13 2196

原创 VS c++ googletest单元测试总结

今天准备写软件测试报告的时候，本来以为会很顺利，没想到竟然耗了一天，最后一个字一个字看笔记才解决，看来好记性真的是不如烂笔头呀。为了巩固记忆、一起学期特来写下这篇博客，以测试最简单的加法计算器为例，需要提前下载googletest-master（自行百度）。最后的目录结构为：1、打开VS，新建win32项目，命名为“PhnoeNumber”（不要问我为什么起这个名字），选择静态库，去掉预编译头，新...

2018-04-26 21:26:34 3653 3

原创涂涂乐制作之不得不说的坑

此博文仅仅用来提醒自己！！！（Unity2017.3）用到安卓的jar文件安卓jar 清单文件匹配sdcard读写权限包括setting中和清单文件中手机屏幕竖屏设置setting和清单文件都要设置关闭setting中的32bit缓存否则会有残影ARCarema中添加的plane不用mesh render否则屏幕中间会有亮线物体的material用location的external...

2018-04-16 16:27:01 1052

原创安卓串口开发（一）——配置环境

最近老师让我们开发一个类似串口调试功能的软件，可以运行在PC上，但是我通过查找资料发现网上很多资料可以查看，比较简单，由于我们六月份去实习，老师说可能做安卓开发，所以我打算用AS写一个串口调试app，由于网上资料很少，所以特写下这篇博客以供相同的技术爱好者学习，如有错误，请指出，定会虚心接受，谢谢！1、首先安卓串口编程，不像是PC，PC可以有虚拟串口，所以我们要用安卓模拟器，有root权限和可以赋...

2018-04-13 20:50:46 1721 1

转载快速拾起程序流程图&盒图（N-S图）&PAD图

在需求分析阶段我们经常会使用不同的手段去剖析我们所要面对的业务，这里我常用的方式有3种：流程图、盒图（N-S图）、PAD图！但是老实说，我90%时候都只用流程图并配合思维导图，因为我实在受不了盒图和PAD图那混乱的表达方式！作者：三角君链接：https://www.jianshu.com/p/4a339e558b5f來源：简书著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。...

2018-04-09 08:26:17 9150

转载串的模式匹配算法---Horspool及其实现

Horspool算法是一种基于后缀的匹配方法，它的主要难点在于如何安全地移动窗口，以避免遗漏可能的成功匹配。 1，Horspool的基本思想　　horspool算法将主串中匹配窗口的最后一个字符跟模式串中的最后一个字符比较。如果相等，继续从后向前对主串和模式串进行比较，直到完全相等或者在某个字符处不匹配为止（如下图中的α与σ失配）。如果不匹配，则根据主串匹配窗口中的最后一

2017-11-30 22:43:31 1334

转载至今为止最易懂的BM算法精讲

原文链接：https://www.cnblogs.com/xubenben/p/3359364.htmlBM算法后缀匹配，是指模式串的比较从右到左，模式串的移动也是从左到右的匹配过程，经典的BM算法其实是对后缀蛮力匹配算法的改进。所以还是先从最简单的后缀蛮力匹配算法开始。下面直接给出伪代码，注意这一行代码：j++；BM算法所做的唯一的事情就是改进了这行代码，即模式串不是每次移动一步

2017-11-30 22:41:17 7553 2

原创 RGB彩色空间和YIQ、灰度等的转化

最近看到不同色彩空间的转化，RGB可以到灰度但是灰度不能到RGB。一般彩色图像至少需要三个维度的信息，比如RGB、HSV、YIQ等等。每种颜色相当于一个三维向量，不同的表示法则相当于同一个向量在不同的坐标轴下（即不同的基下）的表示。而将其变为灰度后，只剩下一个维度，相当于将三维向量投影为一维标量一样，是不可能回复为原来的向量的。要想恢复，就必须储存另外两个维度的信息，合在一起还是三维向量，这还

2017-11-15 21:54:57 7539

空空如也

空空如也