AIGC实战——基于Transformer实现音乐生成

盼小辉丶

已于 2024-10-31 09:39:15 修改

阅读量4.7k

点赞数 79

分类专栏： AIGC生成式人工智能从入门到实战文章标签： AIGC transformer 深度学习

于 2024-04-24 08:12:16 首次发布

本文链接：https://blog.csdn.net/lovemy134611/article/details/138142967

版权

AIGC生成式人工智能从入门到实战专栏收录该内容

27 篇文章 57 订阅 ¥39.90 ¥99.00

订阅专栏

本文介绍了如何使用Transformer模型进行音乐生成，特别是处理音乐数据和构建MuseNet模型。通过音乐的分词和数据集创建，探讨了如何训练模型以预测音乐序列。音乐生成涉及到音符和节奏的复杂交互，Transformer模型通过多输入/输出和正弦位置编码处理这些挑战。文章还讨论了单声部和多声部音乐的分词方法，如网格分词和基于事件的分词，以适应多声部音乐的生成。

摘要由CSDN通过智能技术生成

AIGC实战——基于Transformer实现音乐生成

0. 前言

Transformer 是最流行的音乐生成技术之一，因为音乐可以视为一个序列预测问题，Transformer 模型将音符视为一个个符号的序列(类似于句子中的单词)，从而用于生成音乐。Transformer 模型基于先前音符预测下一个音符，生成音乐作品。在本节中，将学习如何处理音乐数据，并应用 Transformer 生成与给定训练集风格相似的音乐。

1. 音乐生成的挑战

要让机器创作出悦耳的音乐，则必须克服与文本生成中所介绍的相似的技术挑战。模型必须能够学习并再现音乐的序列结构，且能够根据一组离散概率选择下一个音符。
然而，除了文本生成所需的技术外，音乐生成还存在其他挑战，即音高和节奏。音乐通常是多声部的，即不同乐器同时演奏多个音符流，它们结合在一起形成的是和声有可能不协和(刺耳)也有可能不协和(和谐)。文本生成仅需要处理一个单一的文本流，而音乐生成则需要处理多个并行的和弦流。
此外，文本生成可以逐个单词处理。但与文本数据不同，音乐是一个多部分、相交织在一起的声音轴，这些声音不一定同时出现，不同乐器之

了解本专栏