wav2lip算法TypeError: mel() takes 0 positional arguments but 2 positional arguments

浪吗？

已于 2024-03-13 17:47:14 修改

阅读量412

点赞数 3

文章标签：语音识别自然语言处理 word2vec

于 2024-03-13 16:43:06 首次发布

本文链接：https://blog.csdn.net/Hoooooooocc/article/details/136684253

版权

第一，报错源于librosa版本升级了，毕竟wav2lip上一次github更新已经过去好多年了。

第二，解决方法：不需要降版本，只需要去掉后面几个参数，修改如下：

librosa.filters.mel(sr=float(hp.sample_rate), n_fft=hp.n_fft)

第三，如果你选择降版本，可以降到0.7.1，并保持传参如下：

librosa.filters.mel(hp.sample_rate, hp.n_fft, 
                    n_mels=hp.num_mels,fmin=hp.fmin, fmax=hp.fmax)

问题解决的请点赞！

补充：

可能你会跟我一样遇到 :

urllib.error.URLError: urlopen error [SSL: CERTIFICATE_VERIFY_FAILED]

SSL证书过期，验证错误之类，解决方法：

在 inference.py 开头加入以下内容：定义ssl全局取消证书验证

import ssl

ssl._create_default_https_context = ssl._create_unverified_context

优惠劵

浪吗？

关注关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
wav2lip算法TypeError: mel() takes 0 positional arguments but 2 positional arguments

wav2lip遇到的问题
复制链接

扫一扫

feature_extraction.py

05-27

# -*- coding: utf-8 -*- import numpy as np import librosa import random def extract_power(y, sr, size=3): """ extract log mel spectrogram feature :param y: the input signal (audio time series) :param sr: sample rate of 'y' :param size: the length (seconds) of random crop from original audio, default as 3 seconds :return: log-mel spectrogram feature """ # normalization y = y.astype(np.float32) normalization_factor = 1 / np.max(np.abs(y)) y = y * normalization_factor # random crop start = random.randint(0, len(y) - size * sr) y = y[start: start + size * sr] # extract log mel spectrogram ##### powerspec = np.abs(librosa.stft(y,n_fft=128, hop_length=1024)) ** 2 #logmelspec = librosa.power_to_db(melspectrogram) return powerspec def extract_logmel(y, sr, size=3): """ extract log mel spectrogram feature :param y: the input signal (audio time series) :param sr: sample rate of 'y' :param size: the length (seconds) of random crop from original audio, default as 3 seconds :return: log-mel spectrogram feature """ # normalization y = y.astype(np.float32) normalization_factor = 1 / np.max(np.abs(y)) y = y * normalization_factor # random crop start = random.randint(0, len(y) - size * sr) y = y[start: start + size * sr] # extract log mel spectrogram ##### melspectrogram = librosa.feature.melspectrogram(y=y, sr=sr, n_fft=2048, hop_length=1024, n_mels=90) logmelspec = librosa.power_to_db(melspectrogram) return logmelspec def extract_mfcc(y, sr, size=3): """ extract MFCC feature :param y: np.ndarray [shape=(n,)], real-valued the input signal (audio time series) :param sr: sample rate of 'y' :param size: the length (seconds) of random crop from original audio, default as 3 seconds :return: MFCC feature """ # normalization y = y.astype(np.float32) normalization_factor = 1 / np.max(np.abs(y))

wav2lip checkpoint-path相关文件

03-20

wav2lip checkpoint_path相关文件

参与评论您还未登录，请先登录后发表或查看评论

数字人说话工具Wav2Lip离线版V1.0

10-15

数字人说话工具Wav2Lip离线版V1.0 1、AI换脸软件V3.0离线版Windows版本 https://download.csdn.net/download/qq_24252589/88427155 2、Mac版本AI换脸软件离线版 https://download.csdn.net/download/qq_24252589/88427172 3、DeepfaceLive 直播换脸+模型 https://download.csdn.net/download/qq_24252589/88427307 4、Window版本AI人脸替换工具V2.0 https://download.csdn.net/download/qq_24252589/88247062 5、AI全自动剪辑软件V10.1版本 https://download.csdn.net/download/qq_24252589/88430500 6、DragGAN图片说话工具 https://download.csdn.net/download/qq_24252589/88430541

Wav2Lip-HD预训练模型第一个包，包含人脸检测模型，语音驱动面部模型等

06-20

Wav2Lip-HD预训练模型第一个包，包含人脸检测模型，语音驱动面部模型等，用于数字人语音驱动面部及图像超分辨率

wav2lip高清虚拟数字人生成代码

06-21

wav2lip高清虚拟数字人生成代码

【debug】TypeError: mel() takes 0 positional arguments but 2 positional arguments (and 3 keyword解决

cxxx17的博客

02-14

8560

# code librosa.filters.mel(hparams.sample_rate, hparams.n_fft, n_mels=hparams.acoustic_dim, fmin=hparams.fmin, fmax=hparams.fmax) 报

最新嘴型融合模型SadTalker

04-01

3324

环境windows 10 64bitSadTalkertorch 1.12.1+cu113安装配置创建一个全新的 python 虚拟环境condacreate-nsadtalkerpython=3.8 condaactivatesadtalker然后，拉取源代码，并且安装对应的依赖gitclonehttps://github.com/Winfredy/SadTalker.git c...

python常见报错：xxx takes 0 positional arguments but 1 was given

qq_35985044的博客

08-17

1385

上述代运行时发现程序报错：catch() takes 0 positional arguments but 1 was given 意思是catch()这个方法并没有位置参数，却被传进了一个位置参数。经查阅发现：Python在类中定义方法的时候，方法会被传进一个参数，即当前对象的地址，所以一般在类中定义方法的时候，必须在方法中至少定义一个参数。一般情况下我们将其命名为"self"，但是实例方法的第一个参数不一定要叫self，其实完全可以叫任意参数名，比如：a,b,c等等，只是约定俗成的把该参数命名为self

报错：TypeError:mfcc() takes 0 positional arguments but 2 positional arguments (and 1 keyword-only...

qq_57438473的博客

04-26

2973

报错：TypeError:mfcc() takes 0 positional arguments but 2 positional arguments (and 1 keyword-only argument) were given.

唇形同步模型文件 wav2lip_gan.pth

04-09

本文件是开源项目 https://github.com/Rudrabha/Wav2Lip 唇形同步的例子所需的模型文件。作者放在 google 网盘里，国内下载很不方便。于是我提供了一份在这儿。

Wav2lip 语音驱动Ai数字人源码与模型

03-16

为了解决以上问题，wav2lip提出了一个专家口型同步判别器，该判别器在真实视频中进行预训练，并包含多帧信息，可用于判断音频和口型是否同步。实验证明，相比于基于像素的人脸重建方法，这个专家判别器在口型同步...

wav2lip-gan.pth 资源

热门推荐

littlezhuhui的专栏

08-09

2万+

在python函数的形式参数前可以加**，表示该参数位置处应传入字典据。测试例子如下： def test(**kwargs): print(kwargs) test(1) 运行结果如下： Traceback (most recent call last): File "E:/pythonWorkSpace/test1/testConstruct.py", line 5, in &...

TypeError: mel() takes 0 positional arguments but 5 were given

UreisenL的博客

03-04

752

记录一下在服务器运行vits-finetuning时遇到的问题。

wav2lip codeformer

09-10

wav2lip codeformer是一种音频到视频的合成技术。它结合了wav2lip模型和codeformer模型的优势。首先，wav2lip模型是一个用于语音到唇形视频合成的神经网络模型。它采用一段音频作为输入，并生成与音频内容相对应的唇形视频。这个模型能够很好地捕捉到语音的特征，如语速、语调、情感等，并将这些特征转化为对应的唇形动画。而codeformer模型是一种用于文本到视频合成的神经网络模型。它将文本作为输入，并生成对应的视频内容。这个模型能够理解文本的语义、逻辑和情感，并将其转化为视觉效果。 wav2lip codeformer则将这两个模型结合起来，实现了从音频到视频的合成过程。它首先使用wav2lip模型将音频转化为唇形视频，然后将这个视频作为输入传递给codeformer模型。codeformer模型根据视频中唇形的动画和音频的内容，生成一个更加精细的、符合语义和逻辑的视频。 wav2lip codeformer在很多应用场景中都能发挥重要作用。比如，在电影制作中，可以使用这个技术为人物角色添加对话或修复语音与唇形不对应的问题。此外，在虚拟现实和增强现实领域，这个技术也能用于语音合成和人机交互，使得虚拟角色能够更加自然地表现出唇形动画。总之，wav2lip codeformer是一种能够实现音频到视频合成的技术，结合了wav2lip模型和codeformer模型的优点，具备广泛的应用前景。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交