楼下创了电瓶车-CSDN博客

原创 redis

假设线程a执行完后，去释放锁。时，如果此时有大量的用户请求，都无法在 Redis 中处理，于是全部请求都直接访问数据库，从而导致数据库的压力骤增，严重的会造成数据库宕机，从而形成一系列连锁反应，造成整个系统崩溃，这就是。，导致请求在访问缓存时，发现缓存缺失，再去访问数据库时，发现数据库中也没有要访问的数据，没办法构建缓存数据，来服务后续的请求。如果锁过期的时候，并发多个客户端同时请求过来，都执行jedis.getSet()，最终只能有一个客户端加锁成功，但是该客户端锁的过期时间，可能被别的客户端覆盖。

2024-06-20 17:14:16 654

原创 Identity-Preserving Talking Face Generation with Landmark and Appearance Priors

首先，我们设计了一个transformer为基础的地标生成器，从音频获得准确的唇和下巴的标志。给定音频序列和初始输入视频，本文目标是逐帧完成输入视频的下半部分被遮挡的脸部来生成口型同步的说话脸部视频。在推理过程中，将生成的全脸粘贴到原始帧上，由于生成的人脸可能包括一小部分伪影背景，通过高斯平滑的人脸mask将生成人脸与原始帧的背景合成，如图。此处输入数据主要由三部分组成，取连续5帧，音频数据和先前的landmarks为输入，主要是嘴唇和下巴位置的坐标。上方公式左侧代表第t层，下巴和嘴唇处预测得到的坐标。

2024-05-08 16:01:47 1104

原创 SyncTalk The Devil is in the Synchronization for Talking Head Synthesis|论文随记

如图2所示。SyncTalk主要由3部分组成：a）由FaceSync控制器控制的嘴唇运动和面部表情，b）由HeadSync稳定器提供的稳定头部姿势，c）由动态肖像渲染器渲染的高同步面部帧。

2024-03-08 15:55:38 1098 1

原创分布式搜索elaticsearch-数据CRUD操作方法

先从mysql数据库中查询到所需要新增的数据后，将其转换为文档类型，再通过client插入。下方代码展示了局部更新的例子，操作只更新提到的参数，其余未提到的参数保持不变。从MySQL数据库中查询到相关数据后，将其转化为json格式，存入。

2024-01-23 21:01:59 366 1

原创 SpringAMQP的使用

消息传递中，传递对象的序列换与反序列化都是JDK的默认实现，可以将其修改为jackson实现。发送信息示例代码：在publisher服务中新建一个测试类，编写测试方法。也需要在yml文件中添加rabbit配置。在consumer中新建一个类，添加。AMQP是一种消息通信的协议。

2024-01-23 12:33:43 460 1

原创 docker操作简介

Docker 是一种轻量级的容器化平台，允许您打包应用程序及其依赖项、配置和运行时环境为一个统一的容器。以上命令是 Docker 中常用的一些基本操作，帮助您管理镜像和容器。通过这些操作，您可以轻松部署、运行和管理 Docker 容器化的应用程序。以上命令是 Docker 中常用的一些基本操作，帮助您管理镜像和容器。通过这些操作，您可以轻松部署、运行和管理 Docker 容器化的应用程序。显示所有的 Docker 容器，包括正在运行和已停止的。通过 Dockerfile 构建新的镜像，使用。

2024-01-21 14:55:27 441

原创网关gateway服务搭建

uri：路由的目标地址，lb代表根据服务名负载均衡。predicates：判断路由的规则。id：路由的唯一标识。

2024-01-20 16:42:33 391

原创 Eureka服务

其他模块如果需要使用微服务调用http请求获取其他服务的功能，需要先在eureka服务端进行注册，然后即可通过eureka调用其他模块的服务。注册的步骤是，引入依赖，再添加注册配置信息。引入maven依赖，添加server启动类注解，注册url和端口号之后，服务端搭建完成。需要有一个注册服务的module。

2024-01-10 12:45:22 379 1

原创 MetaPortrait Identity-Preserving Talking Head Generation

模型按照上图2，可以分为四个部分如下：（a）给定源图像和t个驱动帧序列，对其提取Landmark特征并编码；（b）根据concate的输入，估计源图像和驱动帧之间的扭曲流www；（c）使用ID保持网络，进一步细化扭曲后的输入源图像；（d）增强上采样并生成最终的高分辨率图像。

2023-12-09 15:26:40 231

原创 Implicit Identity Representation Conditioned Memory Compensation Network

首先用关键点检测器，得到成对的驱动和源图像的K对关键点；估计两个关键点得到密集运动流，对源图像特征进行扭曲后得到扭曲特征；将关键点特征和扭曲特征一起经过MLP编码送入IICM模块，以编码隐式身份表征。它将作为元存储Mo的查询条件，来产生源身份相关的存储体Ms；内存补偿模块（MCM），在获得Ms之后，利用动态交叉注意机制在MCM模块中对变形的源特征图进行空间补偿，然后输出补偿后的特征图Fi cpt。通过解码器解码生成目标图像。

2023-12-04 16:22:50 102

原创 Efficient Emotional Adaptation for Audio-Driven Talking-Head Generation

利用优化后的EAT模型和我们的训练损失，我们仅在映射网络和EAM模块中添加额外的CLIP损失进行微调。具体而言，我们使用CLIP的图像编码器从预测的说话脸中提取图像嵌入，使用其文本编码器从描述中提取文本嵌入。(b) 我们的 EAT 通过灵活的指导，包括情感提示或文本引导的 CLIP 监督，通过轻量级的调整，将情绪不可知的头部说话模型转变为情绪可控的模型。这消除了对情感训练数据的需求，并能够推广到需要罕见表情的应用。，提出了一种参数高效的情感适应方法，用于快速适应预训练的说话头模型，以应对情感说话头任务。

2023-11-23 11:47:31 280

原创 Learning Dynamic Facial Radiance Fields for

与传统的图像生成模型不同，NeRF 不仅仅生成颜色值，还生成了与场景中每个点的方向相关的辐射亮度。（例如说话时嘴唇的变形，嘴角附近的3D点被映射回参考图像，可能会偏离正确的口型）。大量的实验表明，本文方法在有限的训练数据和迭代下，生成的自然说话视频具有优越性。对于一个任意的人，只有一个短的训练视频剪辑可用，一个个性化音频驱动的人像动画模型与高质量的合成结果应该只需要几次迭代的微调。对于一个任意的未见过的身份，只需要一个简短的训练片段，只需要他/她的几十秒的讲话视频，基于预训练的基础模型进行微调。

2023-11-16 10:24:00 210 1

原创 Flow-guided One-shot Talking Face Generation with a High-resolution

本文的方法也获得了最好的结果。的生成中，给定一对面部动画参数，3DMM能够在内面部生成精确的密集运动流（图5（b）中的绿色部分）。然而，3DMM 无法描述面部区域之外的运动（图 5 (b) 中的蓝色和橙色部分）。与sota的方法进行定量和定性比较，在HDTF数据集上对比的结果如下，可以观察到，本文的方法具有很强的竞争力。提出了一个新的流引导的框架，由一个动画生成器和一个流引导的视频生成器构成。如图5（b）所示，将面部图像裁剪为三个部分：内面部部分（绿色）、上躯干部分（橙色）和头部相关部分（蓝色）。

2023-11-11 22:55:13 678 1

原创 springboot打包jar运行报错——*Exception in thread “main“

因为idea运行的时候，直接从代码运行，没有通过maven打包成jar再运行。maven打包jar，根据pom.xml进行打包配置的，这个文件找不到，jar包的main启动class出错，就报错了。修改pom.xml文件中的如下部分，原有的配置只填写了启动类的名称而忽略了位置。在本地测试项目打包，打包成jar之后尝试在cmd运行。为什么在idea运行的时候没有报错？

2023-11-04 14:33:42 1080 2

原创论文随记|Depth-Aware Generative Adversarial Network for Talking Head Video Generation

网络可分为三个部分：（1）人脸深度网络FdF_{d}Fd（2）深度引导稀疏关键点检测子网络FkpF_{kp}Fkp，输入源和驱动图像，使用FdF_{d}Fd生成的深度图与相应的RGB图像结合，学习用于检测面部关键点的几何和外观特征，可以生成可用于生成人脸的相对运动场（3）特征扭曲模块，接收关键点作为输入来生成运动场，运动场用于扭曲源图像特征图以与外观信息融合，从而产生扭曲的特征FwF_{w}Fw。为了强制模型专注于面部结构和微表情运动，模型使用源深度图D。

2023-11-03 22:01:56 191

原创 youtube-dl报错解决

发现这个项目比youtube-dl更新更全面，因此我选择了在脚本中用yt-dlp替换youtube-dl工具，成功解决了报错问题并开始正常下载视频。通过报错的信息和搜索，得到可能是如下问题：youtube-dl版本太旧，我是2021.12版本的，我感觉确实是有些旧了，结果上github官方查看发现已经是最新版本。最后在stackflow论坛得知此项目好像已经被作者放弃。在下载HDTF数据集中遇到了此问题，因为需要从youtube上直接下载视频，官方作者所给的脚本运行发生错误。

2023-10-30 21:44:26 2648 1

原创 DPE Disentanglement of Pose and Expression for General Video Portrait Editing

设计一组用于解耦合的约束，如图三所示的三条虚线所一一对应的元组，即、和。是解开纠缠的核心，即和对，可以驱动生成器输出有意义的面部，并且鼓励编辑模块提取准确的姿势和表情。该指示器指示要编辑的源图像的姿势或表情。文中通过举一个矩形缩小的例子，来说明对于表情和姿势生成器的训练需要加上一定的约束，否则不能将两种信息进行解耦合。对于接受驱动图像的运动编码器，没有使用单独的编码器，而是根据编码器的潜在空间构建运动空间。

2023-10-25 11:00:39 175

原创多种学习方法

自监督学习是一种监督学习变种，它侧重于从未标记的数据中自动生成训练信号。例如，在计算机视觉中，可以设计任务来预测图像中的像素值或图像的旋转角度。在监督学习中，模型使用具有明确标签的训练数据进行学习。监督学习适用于各种任务，如图像分类（将图像分为不同类别）、语音识别、自然语言处理中的命名实体识别等。迁移学习是一种学习方式，其中一个模型在一个任务上进行训练，然后将已学到的知识应用于另一个相关任务上。在医学图像分析中，例如，一个图像可能包含多个肿瘤，模型的任务是确定图像中是否存在肿瘤。

2023-10-22 18:02:28 50 1

原创论文随记|One-Shot High-Fidelity Talking-Head Synthesis with Deformable Neural Radiance Field基于可变形神经辐射场的o

LED 采用顶点到像素对应和位置编码来学习逐点 3D 变形。它既轻量又高效，因为它不需要为每个采样点找到最近的驱动网格顶点并显式计算其与相应规范网格顶点的距离。此外，LED 中的编码器和解码器网络是完全卷积的且非常浅，因此在计算上比其他基于 MLP 的变形场要高效得多。

2023-10-21 14:59:59 206 1

原创 MyBatis

三个注解分别代表getter、setter方法，有参无参构造方法。可以简化实体类的定义。既可以作用在函数上，也可以作用在类上，连接后组成完整的路径。

2023-10-20 11:48:00 37 1

原创 DiffTalk: Crafting Diffusion Models for Generalized Audio-Driven Portraits Animation制作广义音频驱动人像动画的扩散模

提出了一种条件扩散模型用于talking head生成。引入平滑信号作为条件，生成过程是音频驱动、与时间相关的去噪过程

2023-10-19 17:46:41 484 1

原创【操作系统原理要点笔记附带英文词汇】

Command-Line(CLI),GraphicsUserInterface(GUI),Batch命令行（CLI）、图形用户界面（GUI）、批处理manipulation操纵facilities设施Accounting核算parameter参数Statusinformation状态信息implementaregistryimplementaregistrystoreandretrieveconfigurationinformation存储和检索配置信息overhead开销Interpro

2022-03-08 13:15:36 1418

原创定义学生类：定义教师类：

定义学生类：（1）有平时（int）、期末成绩（int）、组成比例（float）三个私有数据成员；（2）有成员函数setProp，根据键盘输入，设置组成比例，取值在0到1之间，比如0.4，则表示成绩=平时40%+期末60%；（3）有计算并输出成绩函数compScore，根据组成比例计算并输出成绩。定义教师类：（1）有私有数据成员stu，是学生对象指针；（2）有构造函数，带整型参数，以其值为大小创建学生对象数组，用stu指向；（3）有成员函数assign，参数为数组下标，用于为一个学生对象设置平时

2021-03-22 23:19:06 1412

weixin_51172489的博客