目录 引言 使用半精度 使用CPU卸载 使用Better Transformer 使用Flash Attention 2 安装 使用 组合优化技术 使用技巧 BarkConfig 实例化 BarkConfig 参数说明 BarkProcessor 参数 __call__ 方法 from_pretrained 方法 save_pretrained 方法 BarkModel 生成语音 示例 启用 CPU 卸载 参数 BarkSemanticModel forward 方法 参数 BarkCoarseModel forward 方法 参数 BarkFineModel forward 方法 参数 BarkCausalModel forward 方法的参数 BarkCoarseConfig 参数 示例: BarkFineConfig 参数 示例: BarkSemanticConfig 参数 示例: 引言 Bark是由Suno AI提出的基于变换器的文本到语音模型,它包括四个主要模型: BarkSemanticModel(文本模型):一个因果自回归变换器模型,它接收被标记化的文本作为输入,并预测捕捉文本含义的语义文本标记。 BarkCoarseModel(粗糙声学模型):一个因果自回归变换器,