基于LSTM算法中文歌词生成

橙汁啤

于 2024-03-09 05:36:40 发布

阅读量860

点赞数 3

分类专栏： # 视觉项目文章标签： lstm 算法人工智能

本文链接：https://blog.csdn.net/qq_46345319/article/details/136575501

版权

视觉项目专栏收录该内容

3 篇文章

订阅专栏

文章目录

一、摘要
二、实验

一、摘要

基于LSTM的歌词生成器。首先，从预训练的GloVe词向量中加载词汇表和词向量，然后使用这些词向量构建一个嵌入矩阵。接着定义了一个LSTM模型，该模型包含一个嵌入层、一个LSTM层和一个全连接层。在训练过程中，模型使用交叉熵损失函数和Adam优化器进行参数更新。最后，通过输入一段歌词的开头，模型可以生成指定长度的歌词。

二、实验

2.1、数据准备

此数据集近1000首歌，分成5份json文件，每个文件对应于一位歌手。json数据里面包括了Name歌名、Singer歌手和Lyric歌词。
在这里插入图片描述

2.2 数据预处理

定义了一个名为get_batches的函数，用于将输入数组arr划分为大小为batch_size的小批次，每个小批次包含seq_length个连续的元素。函数的输出是一个生成器，每次迭代返回一个小批次的数据。
具体来说，函数首先计算总批次大小batch_size_total，然后根据该值确定可以划分的批次数量n_batches。接着，将输入数组arr截取到合适的长度，并将其重塑为形状为(batch_size, -1)的二维数组。
接下来，函数使用一个循环遍历重塑后的数组，每次取出长度为seq_length的连续元素作为输入x，并创建一个与x形状相同的零矩阵y作为目标输出。在循环中，尝试将x的第二个元素到倒数第二个元素赋值给y的前seq_length-1个元素，将arr中的下一个元素赋值给y的最后一个元素。如果发生索引越界错误（即已经到达数组末尾），则将x的第二个元素到倒数第二个元素赋值给y的前seq_length-1个元素，将arr的第一个元素赋值给y的最后一个元素。
最后，函数通过yield关键字返回当前批次的输入x和目标输出y。
在这里插入图片描述