马鹤宁-CSDN博客

原创 TensorRT介绍

TensorRT文章目录TensorRT训练和推理的区别TensorRTTensorRT 优化和性能TensorRT 工作原理Python APIImporting TensorRT Into PythonCreating A Network Definition In PythonBuilding An Engine In PythonSerializing A Model In PythonPerforming Inference In PythonexamplesWorking With Mixed

2021-03-03 21:27:29 44705 2

原创长短期记忆网络（Long Short-Term Memory，LSTM）及其变体双向LSTM和GRU

LSTM（Long Short-Term Memory）长短期记忆网络，是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。LSTM是解决循环神经网络RNN结构中存在的“梯度消失”问题而提出的，是一种特殊的循环神经网络。

2018-07-05 16:52:07 79434 7

原创卷积神经网络常见架构AlexNet、ZFNet、VGGNet、GoogleNet和ResNet模型

目前的常见的卷积网络结构有AlexNet、ZF Net、VGGNet、Inception、ResNet等等，接下来我们对这些架构一一详解。

2018-06-22 16:19:10 50837 12

原创【文生图系列系列】腾讯混元文生图大模型HunyuanDiT

本博文详细记录了腾讯混元文生图大模型HunyuanDiT的搭建和测试过程。

2024-05-21 10:01:18 3116 2

原创 python中的async和await用法

此篇文章介绍了python语言异步编程中async和await的用法

2024-03-19 14:04:12 9563 1

原创【AI数字人-论文】RAD-NeRF论文

本篇博文解读了RAD-NeRF论文

2024-02-24 19:17:31 1642

原创【AI数字人-论文】AD-NeRF论文

本篇博客为AD-NeRF论文的解读。

2024-02-19 21:51:41 1440 1

原创【AI数字人-论文】GeneFace++

本篇博文介绍了Geneface++这篇论文

2024-02-06 13:18:58 2239

原创 python多线程编程（二）

这一篇主要是线程池的基础知识和应用

2024-02-05 14:19:30 1101

原创 python 多线程编程（一）

这篇文章是我学习多线程编程时的笔记，从不同的网站和分享文章中拼接而来，与大家分享。

2024-02-04 20:19:32 854

原创【AI数字人-论文】Geneface论文

本文介绍了ICLR2023的论文geneface

2024-02-02 18:08:10 2923

原创记录一下误删除libc.so.6的经历

一次误删libc.so.6的感悟

2024-01-11 14:17:15 1736

原创【AI数字人-论文】DINet论文解读

本篇博客主要详细解决DINet论文。

2023-12-06 17:18:55 1607

原创 Cmake时遇到Could Not find CURL问题

记录cmake时Could Not find CURL的问题的解决方案。

2023-12-05 14:33:11 3680 1

原创【AI数字人-论文】Wav2lip论文解读

本篇文章详细介绍了wav2lip模型的架构

2023-11-29 18:08:18 4756

原创 vim 文件在linux不换行，只显示^M解决办法

解决log文件中显示^M无换行的问题

2023-11-21 10:21:15 987

原创【已成功】deepspeech 0.9.3中文模型如何转.pb模型

本篇博文记录了如何将deepspeech官方提供的普通话预训练模型转换成.pb模型

2023-10-19 14:34:35 910 1

原创【AI数字人】如何基于GeneFace自训练AI数字人

本篇文章详细介绍了如何基于GeneFace项目开启训练的步骤。

2023-10-13 09:43:28 3565 3

原创 Pytorch错误：AssertionError: If capturable=False, state_steps should not be CUDA tensors

pytorch 1.12.0的bug

2023-10-09 14:42:09 1354

原创【AI数字人】如何基于ER-NeRF自训练AI数字人

ER-NeRF，能够以更小的模型尺寸和更快的速度训练合成逼真的3D talking portrait。本文介绍了如何基于ER-NeRF自训练AI数字人。

2023-09-07 16:57:34 942

原创【AI数字人】如何基于DINet+Openface自训练AI数字人

此篇博客记录了如何配置DINet和Openface的环境，以及如何训练DINet定制数字人。

2023-09-01 14:57:52 874

原创【文生图系列】Denoising Diffusion Probabilistic Models论文解读

此篇文章详细介绍了DDPM的原理，包含公式推导过程。

2023-08-18 16:59:42 827

原创【文生图系列】Runaway Gen-2试用体验

本文试用了Runaway Gen-2，列出了若干示例。

2023-08-01 17:52:54 1538

原创【文生图系列】如何在Stable Diffusion Webui中使用ControlNet

本文介绍了ControlNet的基本原理，以及ControlNet在Stable Diffusion Webui中的插件安装和使用方式。

2023-07-24 16:18:17 1877 1

原创【文生图系列】stable diffusion webui 汉化（双语）教程

此篇博文记录了stable diffusion webui的汉化步骤。

2023-07-18 17:10:08 2620

原创【文生图系列】Stable Diffusion Webui安装部署过程中bug汇总（Linux系统）

部署stable diffusion webui过程中碰见的bug汇总

2023-07-17 16:26:00 1726

原创【文生图系列】文生图大模型合集与效果对比

本篇博文粗略了介绍了OpenAI的DALL E系列，百度的ERNIE-ViLG系列，google的Imagen，MidJourney，Stable Diffusion，智源研究院的AltDiffusion，英伟达的eDiff-I和阿里的通义文生图大模型，并进行了效果对比。

2023-07-06 23:06:52 22770 2

原创【已解决】cc1plus: fatal error: cuda_runtime.h: No such file or directory

本博客记录了xformers安装过程中cuda_runtime.h文件找不到的解决方案。

2023-07-05 17:48:59 7102 2

原创 conda虚拟环境中安装的cuda和服务器上安装的cuda的异同

nvidia-smi官方提供的CUDA Toolkit是一个完整的工具安装包。Anaconda 在安装 Pytorch 等会使用到 CUDA 的框架时，会自动为用户安装 cudatoolkit，其主要包含应用程序在使用 CUDA 相关的功能时所依赖的动态链接库，不会安装驱动程序。只要系统上存在与当前的 cudatoolkit 所兼容的 Nvidia 驱动，则已经编译好的 CUDA 相关的程序就可以直接运行，而不需要安装完整的 Nvidia 官方提供的 CUDA Toolkit .

2023-06-28 16:43:47 2666 3

原创【YOLO系列】YOLOX（含代码解析）

YOLOX是来自旷视团队的团队提出了，它再YOLO v3的基础上进行改进，是anchor free类模型。它使用decoupled head替代coupled head，提高head的表达能力。它使用multi positives的技巧，减少高质量预测框的损失。它使用SimOTA在不增加训练时间的前提下进行样本匹配。它使用Mosaic和Mixup进行更强形式的数据增强。多种技巧，让YOLOX模型具有高精度。

2023-06-26 17:15:58 2978

原创【linux】解决Git错误Permission denied（publickey）

解决git 克隆项目时，出现Permission denied（publickey）错误。

2023-06-18 18:48:29 2577 1

原创【文生图系列】基础篇-变分推理（数学推导）

此篇博文主要介绍什么是变分推理(Variational Inference , VI)，以及它的数学推导公式。变分推理，是机器学习中一种流行的方式，使用优化的技术估计复杂概率密度。变分推理的工作原理：**首先选择一系列概率密度函数，然后采用KL散度作为优化度量找到最接近于概率密度的函数**。引入evidence lower bound的方法更容易计算近似概率。

2023-06-18 16:19:44 4850 3

原创【文生图系列】基础篇-马尔可夫链

马尔可夫链是一个数学系统，它根据某些特定的概率规则从一个状态转换到另一个状态。马尔科夫的定义特征是：无论过程如何到达当前的状态，未来的状态都是固定的。也就是说，转换到任何特定状态的概率都取决于当前的状态和过去的时间。

2023-06-13 21:09:11 2209 2

原创【文生图系列】Stable Diffusion原理篇

Stable Diffusion不是一个整体模型，它由几个组件和模型组成。首先是`文本理解组件`（text-understanding component ），将文本信息转换成数字表示，以捕捉文本中的想法。其次是`图像生成器`（image generator），图像生成器包括两步，图像信息创建者（ Image information creator）和图像解码器（Image Decoder）。

2023-06-11 16:19:08 3104