声音克隆添加水印的原理（防止一切滥用）-CSDN博客

本文链接：https://blog.csdn.net/baidu_22713341/article/details/137238821

这段Python代码展示了如何使用预训练模型在音频中添加不可察觉的水印，通过将文本转为比特流，分段嵌入并重复过程，确保信息隐藏。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

【直接上代码】

******

def add_watermark(self, audio, message):
	if self.watermark_model is None:
		return audio
	device = self.device
	bits = utils.string_to_bits(message).reshape(-1)
	n_repeat = len(bits) // 32

	K = 16000
	coeff = 2
	for n in range(n_repeat):
		trunck = audio[(coeff * n) * K: (coeff * n + 1) * K]
		if len(trunck) != K:
			print('Audio too short, fail to add watermark')
			break
		message_npy = bits[n * 32: (n + 1) * 32]
		
		with torch.no_grad():
			signal = torch.FloatTensor(trunck).to(device)[None]
			message_tensor = torch.FloatTensor(message_npy).to(device)[None]
			signal_wmd_tensor = self.watermark_model.encode(signal, message_tensor)
			signal_wmd_npy = signal_wmd_tensor.detach().cpu().squeeze()
		audio[(coeff * n) * K: (coeff * n + 1) * K] = signal_wmd_npy
	return audio

这段代码使用预训练的水印模型向音频中添加水印。水印是一段隐藏的信息，可以嵌入到音频中，而不影响音频的可听性。

原理：