c2a2o2-CSDN博客

转载 Windows 安装 pytorch3d

Windows 安装 pytorch3d首先安装pytorch，我安装的是python 3.8 + cuda 10.2 + pytorch 1.7.1 + torchvision 0.8.2 + cub 1.10.0其中，cudnn和cudatoolkit与cuda的版本一致的，cub直接conda是不行的，需要从github上下载release，再在环境变量里添加CUB_HOME作者：胡写含链接：https://www.jianshu.com/p/ffd696866469来源：简书

2022-03-01 20:50:06 785 1

转载 Pivotal Tuning for Latent-based Editing of Real Images

文中引用一下[38]的论点，越靠近W空间，编辑能力越强。要点：真实图片的inversion空间与GAN的W空间混合，使得它们都在生成器的domain之内。本文研究目标，对于真实图片的高清编辑，论点：对于一个编辑任务，对于真实图片的映射到隐层空间后已经out of domain，导致生成的图片会有伪影，因提出了训练生成器，扩大生成器的输入domain，使得编辑后的采样点也在生成器的输入域范围内。所以，本文在训练的时候是pivotal tuning，轻微调整生成器，使得那些从真实图片映射至隐空间可能

2022-02-14 10:12:32 1067

转载 Python 3 利用 Dlib 实现人脸检测和剪切

0. 引言　　利用 Python 开发，借助 Dlib 库进行人脸检测 / face detection 和剪切；　　1.crop_faces_show.py:　　　　将检测到的人脸剪切下来，依次排序平铺显示在新的图像上；　　　　实现的效果如图1 所示，将图1 原图中的 6 张人脸检测出来，然后剪切下来，在图像窗口中依次输出显示人脸；　　2.crop_faces_save.py:　　　　将检测到的人脸存储为单个人脸图像；　　图 1 原图和crop_...

2022-01-19 19:41:32 3268 1

转载超分辨率：将背景和人脸分离，人脸、背景分别做增分后将人脸贴回背景图

景（自然景物超分辨率）和人脸超分辨率相结合，可以实现更高的超分效果，提升结果的观感。# 问题描述与原因分析：对一张有人脸的图片做超分时候，如果单纯是使用一个自然场景的超分辨率网络，背景部分应该可以较好地还原，毕竟模型在训练的时候有大量的自然景物数据集作为支撑，但是对于人脸区域，使用景物的超分网络效果不一定好，因为人脸超分网络需要用大量的人脸（正脸）数据来训练。解决方案：总体思想是先将图片中的所有人脸检测出来，单独做人脸区域超分，然后对背景做超分，使用Mask的方式将人脸再贴到结果图片。第一步是检

2022-01-07 21:07:28 1027

转载 python怎么变成动图_python简单的图片切换形成动画效果程序

简单事情复杂化了，这个程序实现这个效果还能再度精简很多代码，把类去掉吧，你能自行完成吗？import turtleclass Window:def __init__(self,width,height,bgimages,title="",alt_delay=120,bgcolor="white"):self.screen = turtle.Screen()self.screen.delay(0)self.screen.setup(width,height)self.scree

2021-12-06 09:08:44 1094

转载 Python实现高级电影特效，CXK也能影分身

一、前言前几天写了个实现特效的博客，感觉有点差强人意，只是简简单单的换背景应用场景不是非常多，今天就来实现一个更加复杂的特效“影分身”。下面有请我们本场的主演，坤制作人为我们表演他拿手的鸡你太美。关于实现原理，和上一篇没有本质区别，同样是逐帧处理，但是这里还是详细说一下。光理论是不够的,在此送大家一套2020最新Python全栈项目视频教程，点击此处进来获取跟着练习下，希望大家一起进步哦！二、实现原理首先我们要准备一个视频，作为我们的素材。然后我们要逐帧提取视频中的图像，接下来我们利用pa

2021-12-04 17:17:26 436

转载 [解决方案记录]No module named fused(stylegan2的bug，已更新)

基本情况https://github.com/rosinality/stylegan2-pytorch/issues/81运行psp时出现的问题。其实就是stylegan2里面采用了c++编译等功能带来的bug，非常烦人。系统：windows平台：pycharm + jupyter notebookGPU：GTX1660Ti解决方案(0)无脑但是有效：直接把fused_leakyrelu,upfirdn2d_native和FusedLeakyRelu替换为pytorch实现即可。参

2021-10-03 17:06:12 2851 3

转载设置cl.exe环境变量

先给出两个报错的内容：d:\Anaconda3\envs\torch\lib\site-packages\torch\utils\cpp_extension.py:189: UserWarning: Error checking compiler version for cl: [WinError 2] 系统找不到指定的文件。d:\Anaconda3\envs\torch\lib\site-packages\torch\utils\cpp_extension.py:189: UserWarning:

2021-10-03 14:16:54 4397

转载 python3+opencv生成不规则黑白mask

# -*- coding: utf-8 -*-import cv2import numpy as np # -----------------------鼠标操作相关------------------------------------------lsPointsChoose = []tpPointsChoose = []pointsCount = 0count = 0pointsMax = 10def on_mouse(event, x, y, flags, param): .

2021-09-17 16:17:46 706

转载 python对视频画框标记后保存

需要画框取消注释rectangleimport cv2import os,sys,shutilimport numpy as np# Open the input movie file, input the filepath asinput_filepath = sys.argv[1]input_movie = cv2.VideoCapture(input_filepath)length = int(input_movie.get(cv2.CAP_PROP_FRAME_COUNT))..

2021-09-15 19:50:59 701

转载 stylegan2 示例命令fused_bias_act.cu环境配置异常(无法打开包括文件: “tensorflow/core/framework/op.h”

在python运行stylegan2示例时,运行过程中,触发fused_bias_act.cu中的异常,可以看到fused_bias_act.cu中实际上是用c/c++写的实现代码.仔细看异常信息会发现这句话无法打开包括文件: “tensorflow/core/framework/op.h”:解决策略1.首先确保你安装了c/c++工具集,版本号可以有些不一致,这影响不大,在这里:2.确定你已经调整了工具集引用3.这里我取巧做了步骚操作,不合理但最简单:从[c.

2021-09-09 08:35:19 1185 1

转载 Neighbor2Neighbor: Self-Supervised Denoising from Single Noisy Images

下面内容来自智源研究院CVPR2021预讲华为诺亚专场1、深度学习的图像去噪方法面临的挑战当前方法主要包括三类：基于监督学习的方法：使用 noisy-clean 图像对进行训练（DnCNN, FFDNet, CBDNet, SGNet）。这类方法的难点在于，在真实场景中，比较难以获取 noisy-clean 的图像对 Noise2Noise（ICML18）：使用 Noisy-noisy 图像对进行训练，每个场景都需要 multiple independent observations 。在应.

2021-08-20 10:13:06 2389 1

转载 opencv python 多帧降噪算法_防抖技术 | OpenCV实现视频稳流

在这篇文章中，我们将学习如何使用OpenCV库中的点特征匹配技术来实现一个简单的视频稳定器。我们将讨论算法并且会分享代码(python和C++版)，以使用这种方法在OpenCV中设计一个简单的稳定器。视频中低频摄像机运动的例子视频防抖是指用于减少摄像机运动对最终视频的影响的一系列方法。摄像机的运动可以是平移(比如沿着x、y、z方向上的运动)或旋转(偏航、俯仰、翻滚)。视频防抖的应用对视频防抖的需求在许多领域都有。这在消费者和专业摄像中是极其重要的。因此，存在许多不同的机械、光学和算法

2021-08-02 19:25:50 1679

转载 .bat脚本自动yes_推荐|PyToBI自动标注韵律

oBI(http://www.speech.cs.cmu.edu/tobi/ToBI.1.html)是标注语调模式和其它一些韵律层面的信息的系统，最初提出用于英语句子上，可能目前在其它很多语言都有使用。详细说明可参考它的官方网站，以及有大量的文献。今天推荐大家一款自动标注ToBI语调模式及一些韵律特征的开源工具包，PyToBI，笔者将它fork到我的github上，地址在[https://github.com/feelins/PyToBI]，使用方法同以前，仍然可以点击Download下载整个开源工具包

2021-08-01 09:01:10 337

转载从对比学习(Contrastive Learning)到对比聚类(Contrastive Clustering)

从对比学习(Contrastive Learning)到对比聚类(Contrastive Clustering)作者：凯鲁嘎吉 - 博客园http://www.cnblogs.com/kailugaji/ 想要了解对比聚类，首先应该清楚对比学习的整个过程。最经典的对比学习的文章是Hinton团队提出的SimCLR，该方法首先将一个实例(图像)变换成两种不同的增广实例(图像)，然后用神经网络训练得到投影表示，用余弦相似性求出两两投影表示之间的相似性，并最大化相同实例投影表示之间的一致性。而对比...

2021-07-22 08:59:44 2646

转载 SCAN Learning to Classify Images without Labels(翻译)

SCAN Learning to Classify Images without Labels概览Approach: A two-step approach where feature learning and clusteringare decoupled.Step 1:Solve a pretext task + Mine k nearest neighbrs通过利用特征相似性来挖掘每张图片的最近邻居nearest neighbors，研究发现这些nearest neighbors很

2021-07-15 10:20:18 495

转载【Deep Clustering】Improving Unsupervised Image Clustering With Robust Learning

Abstract非监督图像聚类算法通常是提出一个辅助目标函数间接训练模型，并且聚类结果受到错误的预测和过于自信（overconfidence）的结果的影响，作者通过提出RUC (Robust learning for Unsupervised Clustering)模块解决这个问题，该模块将现有聚类算法生成的伪标签（可能会包含错误分类的样本）看作噪声样本，而它的重新训练过程可以纠正错误分类并缓解过度自信的问题。该模块可以作为其他聚类算法的附加模块用来提高精度RUC主要由两个部分组成：1. ext

2021-07-15 08:39:21 1186

转载对比学习（Contrastive Learning）:研究进展精要

对比学习(Contrastive Learning)最近一年比较火，各路大神比如Hinton、Yann LeCun、Kaiming He及一流研究机构比如Facebook、Google、DeepMind，都投入其中并快速提出各种改进模型：Moco系列、SimCLR系列、BYOL、SwAV…..，各种方法相互借鉴，又各有创新，俨然一场机器学习领域的军备竞赛。对比学习属于无监督或者自监督学习，但是目前多个模型的效果已超过了有监督模型，这样的结果很令人振奋。我想，NLP领域的Bert模型，对于这波图像领域的对

2021-07-13 16:41:33 1991

转载 facebook新无监督论文-Unsupervised Learning of Visual Features by Contrasting Cluster Assignments

最近比较关注无监督论文，因此只要发现有新的文章都会读一遍，facebook近期刚出了一篇Unsupervised Learning of Visual Features by Contrasting Cluster Assignments，这是记录的第二篇讲无监督的文章，和之前那篇思路差别还是比较大的，文章也很良心，有git代码，也顺便看了下实现，文档很详细，代码写的也比较规范，准备后面有时间实验一下效果~概述unsupervised image representations在近些年的工作中已经缩

2021-07-13 16:17:03 4100 1

转载 Ubuntu下使用Anaconda安装opencv 解决无法读取视频

Ubuntu下使用Anaconda安装opencv最近在Ubuntu16.04下使用Anaconda安装opencv，碰到很多坑，记录备忘。可以直接pip安装opencv,但无法读取视频，需要编译源码。Anaconda安装opencv过程1.不能在安装Anaconda的情况下编译opencv，编译会链接Anaconda的库，编译程序会出错。已安装先移除 1.到根目录下，打开终端并输入： sudo gedit ~/.bashrc 2.在.bashrc文件末尾用#号...

2021-07-04 18:19:45 614

转载 nginx实现请求转发

反向代理适用于很多场合，负载均衡是最普遍的用法。nginx 作为目前最流行的web服务器之一，可以很方便地实现反向代理。nginx 反向代理官方文档: NGINX REVERSE PROXY当在一台主机上部署了多个不同的web服务器，并且需要能在80端口同时访问这些web服务器时，可以使用 nginx 的反向代理功能: 用 nginx 在80端口监听所有请求，并依据转发规则(比较常见的是以 URI 来转发)转发到对应的web服务器上。例如有 webmail , webcom 以及 webde

2021-07-01 10:21:12 250

转载 Ubuntu18.04+RTX 2080Ti+CUDA 10.0 +cuDNN+PyTorch搭建深度学习环境

注意tensorflow-gpu-2.0有几处代码改动，在跑faster-rcnn的时候有点问题，所以后面需要把tensorflow-gpu版本改成1.1+的。我这里的环境是：Ubuntu16.04+2080ti+Display Driver430.50+cuda10.0+cudnn7+Anaconda(python3.6)+tensorflow-gpu-1.13.11. 显卡驱动: 版本430.50，有不同的安装格式，这里我下的是runfile。安装显卡驱动步骤：（1）lsmod

2021-06-30 21:26:14 708

转载 COCO2017数据集api说明

什么是COCO？COCO数据集是Microsoft制作收集用于Detection + Segmentation + Localization + Captioning的数据集，本人收集了其2017年的版本，一共有25G左右的图片和600M左右的标签文件。COCO数据集共有小类80个，分别为[‘person’, ‘bicycle’, ‘car’, ‘motorcycle’, ‘airplane’, ‘bus’, ‘train’, ‘truck’, ‘boat’, ‘traffic light’, ‘f

2021-06-28 11:59:57 602

转载深入理解风格迁移三部曲(三)--FUNIT

FUNIT: Few-Shot Unsupervised Image-to-Image Translationproject:https://nvlabs.github.io/FUNIT/作者:陈扬[toc]简介无监督的图像到图像转换方法学习利用图像的非结构化(UNlabel)数据集将给定类中的图像映射到不同类中的类似图像。在ICCV2019上,NVIDIA-Lab发表了Image-to-image最新的研究成果,基于少量类别学习的FUNIT.笔者在CVPR2020的投稿中正好也大量涉及到了

2021-06-23 13:47:30 2424

转载一文搞懂faiss计算

Faiss的全称是Facebook AI Similarity Search。这是一个开源库，针对高维空间中的海量数据，提供了高效且可靠的检索方法。暴力检索耗时巨大，对于一个要求实时人脸识别的应用来说是不可取的。而Faiss则为这种场景提供了一套解决方案。Faiss从两个方面改善了暴力搜索算法存在的问题：降低空间占用加快检索速度首先，Faiss中提供了若干种方法实现数据压缩，包括PCA、Product-Quantization等。（1）对于一个检索任务，我们的操作流程一定分为三步：训练、构.

2021-06-22 16:47:23 2943 1

转载如何利用PyTorch中的Moco-V2减少计算约束

介绍SimCLR论文(http://cse.iitkgp.ac.in/~arastogi/papers/simclr.pdf)解释了这个框架如何从更大的模型和更大的批处理中获益，并且如果有足够的计算能力，可以产生与监督模型类似的结果。但是这些需求使得框架的计算量相当大。如果我们可以拥有这个框架的简单性和强大功能，并且有更少的计算需求，这样每个人都可以访问它，这不是很好吗？Moco-v2前来救援。注意：在之前的一篇博文中，我们在PyTorch中实现了SimCLR框架，它是在一个包含5个类别的简单数据

2021-06-16 13:58:36 233

转载 Understanding the Behaviour of Contrastive Loss理解对比损失的性质以及温度系数的作用

论文标题：Understanding the Behaviour of Contrastive LossUnderstanding the Behaviour of Contrastive Lossarxiv.org对比学习中的温度系数是一个神秘的参数，大部分论文都默认采用小的温度系数来进行自监督对比学习（例如0.07，0.2）。然而并没有对采用小温度系数的解释，以及温度系数是如何影响学习过程的，即温度系数这个角色的意义。本文章对对比损失（Contrastive Loss）中的温度系数进.

2021-06-14 09:55:46 1850 2

转载 ICML 2020: 从Alignment 和 Uniformity的角度理解对比表征学习

Title: 《Understanding Contrastive Representation Learning through Alignment and Uniformity on the Hypersphere》Author:Tongzhou Wang ; Phillip IsolaUnderstanding Contrastive Representation Learning through Alignment and Uniformity on the Hyperspherearxiv.

2021-06-14 09:35:44 5663

转载 Win10 + RTX3090 安装CUDA11.2 + CUDNN8.1.0 安装

前提系统重新安装，anaconda3中tensorflow和pytorch已经安装过，主要目的是方便自己以后重新安装CUDA主机配置系统：Win10 64bitCPU：I9-10850K内存：64G显卡：GeForce RTX 3090显卡驱动：https://www.nvidia.cn/geforce/drivers/CUDA与驱动版本对照-table2https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.ht

2021-06-08 10:57:36 2652 1

转载真·无监督！延世大学提出图像到图像无监督模型，实验结果超SOTA

图像翻译目的是用模型将源域图像转换到目标域图像，通常涉及标签图到场景图的转换、图像风格、人脸的属性变换、标签图到场景图的转换。图像翻译任务自生成对抗网络提出就得到了快速发展，例如经典的pix2pix、CycleGAN、StarGAN。上述模型虽然实现了从源域图像到目标域图像的转换，但也需要一定的标签参与或者需要建立源域和目标域各自的生成器。而近日韩国延世大学的一篇名为《Rethinking the Truly Unsupervised Image-to-Image Translation》的论文

2021-06-04 10:34:50 328

转载 DivCo: Diverse Conditional Image Synthesis via Contrastive Generative Adversarial Network

DivCo: Diverse Conditional Image Synthesis via Contrastive Generative Adversarial Network条件生成对抗网络（Conditional generative advictorial networks，cGANs）的目标是在给定输入条件和latent codes的情况下合成各种不同的图像，但不幸的是，它们通常会遇到模式崩溃的问题。为了解决这个问题，以前的工作[47，22]主要集中在鼓励latent codes与其生成的图像之

2021-06-03 17:10:44 738

转载一篇综述带你全面了解迁移学习的领域泛化(Domain Generalization)

领域泛化 (Domain Generalization, DG)是近几年非常热门的一个研究方向。它研究的问题是从若干个具有不同数据分布的数据集（领域）中学习一个泛化能力强的模型，以便在未知 (Unseen)的测试集上取得较好的效果。本文介绍DG领域的第一篇综述文章《Generalizing to Unseen Domains: A Survey on Domain Generalization》。该论文一共调研了160篇文献，其中直接与领域泛化相关的有90篇。文章从问题定义、理论分析、方法总结...

2021-06-01 15:44:39 3290

转载 t-SNE 原理及Python实例

73 人赞同了该文章t-SNE Python 例子t-Distributed Stochastic Neighbor Embedding (t-SNE)是一种降维技术，用于在二维或三维的低维空间中表示高维数据集，从而使其可视化。与其他降维算法(如PCA)相比，t-SNE创建了一个缩小的特征空间，相似的样本由附近的点建模，不相似的样本由高概率的远点建模。在高水平上，t-SNE为高维样本构建了一个概率分布，相似的样本被选中的可能性很高，而不同的点被选中的可能性极小。然后，t-SNE为低维...

2021-06-01 14:26:02 3566

转载文本纠错与BERT的最新结合,Soft-Masked BERT

文本纠错相关资料1.http://www.doc88.com/p-8038708924257.html2.http://blog.csdn.net/glanderlice/article/details/530057913.https://www.zhihu.com/question/372587484.自然语言处理中的N-Gram模型详解http://blog.csdn.net/baimafujinji/article/details/512818165.中文纠错实战http:

2021-05-27 13:24:15 632

转载损失函数约束类间不一致性

损失函数约束类间不一致性及类内一致性参考书籍：Python深度学习-基于PyTorch交叉熵损失函数对不同类之间的距离的区分性较小。原因：softmax具备分类能力但是不具备度量学习的特征，没法压缩同一类别。因此，研究者们提出了几种损失函数。（1）三元组损失Triplet loss三元组损失属于度量学习，通过计算两张图象之间的相似度，使得输入图像被归入到相似度大的图像类别中去。L t = ∑ [ ∥ f ( x i a ) − f ( x i p ) ∥ 2 2 − ∥ f ( x i a ) −

2021-05-17 08:35:37 438

ffmpeg-4.2.1-win64-win10-然后pip就好

dlib安装 dlib-19.19.0-cp38-cp38-win_amd64.whl.whl

dlib-19.17.99-cp37-cp37m-win_amd64.whl

coreseek-4

空空如也