用 TensorFlow 让你的机器人唱首原创给你听

原创

于 2017-04-26 11:07:49 发布 · 1.8w 阅读

·

12

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器人 #人工智能

Siraj 的视频
 源码

今天想来看看 AI 是怎样作曲的。

本文会用 TensorFlow 来写一个音乐生成器。

当你对一个机器人说：我想要一种能够表达出希望和奇迹的歌曲时，发生了什么呢？

计算机会首先把你的语音转化成文字，并且提取出关键字，转化成词向量。

然后会用一些打过标签的音乐的数据，这些标签就是人类的各种情感。接着通过在这些数据上面训练一个模型，模型训练好后就可以生成符合要求关键词的音乐。

程序最终的输出结果就是一些和弦，他会选择最贴近主人所要求的情感关键词的一些和弦来输出。

当然你不只是可以听，也可以作为创作的参考，这样就可以很容易地创作音乐，即使你还没有做到刻意练习1万小时。

机器学习其实是为了扩展我们的大脑，扩展我们的能力。

DeepMind 发表了一篇论文，叫做 WaveNet, 这篇论文介绍了音乐生成和文字转语音的艺术。

通常来讲，语音生成模型是串联。这意味着如果我们想从一些文字的样本中来生成语音的话，是需要非常大量的语音片段的数据库，通过截取它们的一部分，并且再重新组装到一起，来组成一个完整的句子。

生成音乐也是同样的道理，但是它有一个很大的难点：就是当你把一些静止的组件组合到一起的时候，生成声音需要很自然，并且还要有情感，这一点是非常难的。

一种理想的方式是，我们可以把所有生成音乐所需要的信息存到模型的参数里面。也就是那篇论文里讲的事情。

我们并不需要把输出结果传给信号处理算法来得到语音信号，而是直接处理语音信号的波。

他们用的模型是 CNN。这个模型的每一个隐藏层中，每个扩张因子，可以互联，并呈指数型的增长。每一步生成的样本，都会被重新投入网络中，并且用于产生下一步。

我们可以来看一下这个模型的图。输入的数据，是一个单独的节点，它作为粗糙的音波，首先需要进行一下预处理，以便于进行下面的操作。

接着我们对它进行编码，来产生一个 Tensor，这个 Tensor 有一些 sample 和 channel。

然后把它投入到 CNN 网络的第一层中。这一层会产生 channel 的数量，为了进行更简单地处理。

然后把所有输出的结果组合在一起，并且增加它的维度。再把维度增加到原来的 channel 的数量。

把这个结果投入到损失函数中，来衡量我们的模型训练的如何。

最后，这个结果会被再次投入到网络中，来生成下一个时间点所需要的音波数据。

重复这个过程就可以生成更多的语音。

这个网络很大，在他们的 GPU 集群上需要花费九十分钟，并且仅仅只能生成一秒的音频。

接下来我们会用一个更简单的模型在 TensorFlow 上来实现一个音频生成器。

1.引入packages:

数据科学包 Numpy ，数据分析包 Pandas，tqdm 可以生成一个进度条，显示训练时的进度。

import numpy as np
import pandas as pd
import msgpack
import glob
import tensorflow as tf

最低0.47元/天解锁文章

4 条评论

Stepfen Shawn 2019.05.02
为什么我打不开siraj的视频？

kinbo88 2017.10.14
找不到 midi 模块...

ScorpioDoctor 2017.06.30
[code=html] <a href="studyai.com"> 支持楼主 studyai.com </a> [/code]

微wx笑 2017.05.16
请教一下，如何让它来模仿我自己的声音？仿真度能达到百分之多少？

BURGER- 2017.05.01
厉害

qq_38595198 2017.04.30
[code=delphi] [/code]

评论 6

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。