“ 想象一下,您可以随心所欲地创作轻快的乡村曲风,缠绵的蓝调,史诗般的管弦乐......视频BGM创作之路上,再也不会有任何阻碍!。”
01
—
什么是MusicGen
Meta MusicGen建立在强大的Transformer模型的基础上,追随ChatGPT等语言模型的脚步,采用尖端的AI技术来预测和生成音乐片段。就像语言模型预测句子中的下一个字母一样,MusicGen 根据给定的音乐片段预测下一个音乐片段。
为了完成这一壮举,Meta 的研究人员利用 EnCodec 音频标记器,将音频数据分解为更小的单元以实现高效处理。MusicGen的辉煌之处在于它能够同时处理文本描述和音乐提示,从而实现艺术表达的无缝融合。
培训MusicGen涉及使用由20,000小时授权音乐组成的庞大数据集。该团队利用了 10,000 份高质量录音的内部收藏,并辅以来自 Shutterstock 和 Pond5 等知名来源的音乐数据。这种细致的培训过程确保了MusicGen拥有创作与听众产生共鸣的音乐的能力。
试用地址:MusicGen - a Hugging Face Space by facebook
02
—
MusicGen在线体验
首先我们准备好一些BGM,比如一些激情澎湃的,忧郁的,安静