MacOS Mojave 安装 AI 東北きりたん 东北切蒲英 NEUTRINO 教程

参考【使い方あり】AIシンガー「AIきりたん」が凄すぎる。【まとめ】

  • 东北切蒲英(日语:東北きりたん)是SSS合同会社发表的东北支援角色,是以日本秋田县北部的鹿角市的地方美食切蒲英(日语:“きりたんぽ”)为原型而设定的角色。同时具有UTAU、 NEUTRINO、CeVIO AI歌唱音源和VOICEROID语音声源。
  • 2020年2月22日神秘的软件工程师SHACHI,发布了东北切蒲英的音源演示歌曲,同时也公开配布了基于深度学习的歌声合成引擎NEUTRINO,只要交给她乐谱就可以很熟练的唱起来。1
    东北切蒲英

下载NEUTRINO与KIRITAN音源

前往NEUTRINO官网,点击Start Now来到官方的谷歌云盘,下载以下两个文件,解压备用

NEUTRINO-macOS-v1.0.0.zip
歌声ライブラリ(Singer Library)/東北きりたん(NEUTRINO-Library)-v1.0.0.zip

NEUTRINO官网

导入并使用KIRITAN作为默认音源

将解压出的KIRITAN文件夹放置到NEUTRINO/model,然后编辑NEUTRINO/Run.sh,将ModelDir改为KIRITAN

# NEUTRINO
ModelDir=KIRITAN
StyleShift=0

安装gcc

该软件使用了gcc编译,而mac默认只有clang,因此还需要安装gcc。下面命令应该默认安装gcc11版本,如果安装了其他版本,请强制指定版本为11。

brew install gcc

修复动态链接库错误

NEUTRINO/bin/musicXMLtoLabel的动态链接库指向有误,需要额外修复

cd bin
# 原链接
otool -L musicXMLtoLabel
musicXMLtoLabel:
	/Users/user213944/.homebrew/opt/gcc/lib/gcc/11/libstdc++.6.dylib (compatibility version 7.0.0, current version 7.29.0)
	/usr/lib/libSystem.B.dylib (compatibility version 1.0.0, current version 1311.100.3)
	/Users/user213944/.homebrew/opt/gcc/lib/gcc/11/libgcc_s.1.dylib (compatibility version 1.0.0, current version 1.0.0)
# 进行修改
install_name_tool -change /Users/user213944/.homebrew/opt/gcc/lib/gcc/11/libstdc++.6.dylib /usr/local/opt/gcc/lib/gcc/11/libstdc++.6.dylib musicXMLtoLabel
install_name_tool -change /Users/user213944/.homebrew/opt/gcc/lib/gcc/11/libgcc_s.1.dylib /usr/local/opt/gcc/lib/gcc/11/libgcc_s.1.dylib musicXMLtoLabel
# 再次查看
otool -L musicXMLtoLabel 
bin/musicXMLtoLabel:
	/usr/local/opt/gcc/lib/gcc/11/libstdc++.6.dylib (compatibility version 7.0.0, current version 7.29.0)
	/usr/lib/libSystem.B.dylib (compatibility version 1.0.0, current version 1311.100.3)
	/usr/local/opt/gcc/lib/gcc/11/libgcc_s.1.dylib (compatibility version 1.0.0, current version 1.0.0)

合成测试

使用sample1进行合成测试。修改Run.shBASENAMEsample1

# Project settings
BASENAME=sample1
NumThreads=4

执行Run.sh,观察输出

sistine:NEUTRINO rumia$ ./Run.sh 
03:15 : start MusicXMLtoLabel
    Convert MusicXML to label -> score/musicxml/sample1.musicxml
    output full label -> score/label/full/sample1.lab
    output mono label -> score/label/mono/sample1.lab

03:15 : start NEUTRINO
    NEUTRINO - NEURAL SINGING SYNTHESIZER (Electron v1.0.0-Stable)

    Linguistic feature (duration)       : 1 [msec]
    Load timing model                   : 241 [msec]
        -> Load completed. 
        -> Tohoku Kiritan - NEUTRINO Singer Character Library (v1.0.0-Stable-Timing model)
    Predict timing feature              : 409 [msec]
    Linguistic feature (acoustic)       : 712 [msec]
    Load acoustic model                 : 726 [msec]
        -> Load completed. 
        -> Tohoku Kiritan - NEUTRINO Singer Character Library (v1.0.0-Stable-Acoustic model)
    Predict acoustic features           : 2051 [msec]
    Finish                              : 66688 [msec]
    Generation rate                     : 0.647793 [gen/sec]

    -- File and Parameter information --
    label length     	: 129 [line]
    wav length       	: 43.2 [sec] 
    frame period     	: 5 [frame]
    full_label       	: score/label/full/sample1.lab 
    timing_label     	: score/label/timing/sample1.lab 
    output f0        	: ./output/sample1.f0 
    output mgc       	: ./output/sample1.mgc 
    output bap       	: ./output/sample1.bap 
    model directory  	: ./model/KIRITAN/ 
    stat_timing      	: ./model/KIRITAN/stats_timing.bin 
    model timing     	: ./model/KIRITAN/model_timing.bin 
    stat_acoustic    	: ./model/KIRITAN/stats_acoustic.bin 
    model acoustic   	: ./model/KIRITAN/model_acoustic.bin 
    timing flag      	: 0 
    random flag      	: 0 
    acoustic flag    	: 0 
    number of threads	: 4 
    style shift      	: 0 
    ------------

04:21 : start WORLD
    WORLD - NEUTRINO Edition (v1.0.0-Stable)

    Load Acoustic features   : 1 [msec]
    Decode Acoustic features : 7 [msec]
    Synthesis                : 186 [msec]
    Finish                   : 1518 [msec]
    Generation rate          : 28.4585  [gen/sec]
    -- File and Parameter information --
    wav Length               : 43.2 [sec]
    sampling rate            : 48000 [Hz]
    sampling bit             : 16 [bit]
    pitch shift              : 1 
    formant shift            : 1 
    number of parallel       : 4 [thread]
    hi-speed synthesis       : 0 
    realtime synthesis       : 0 
    smooth pitch             : 0 
    smooth formant           : 0 
    enhance breathiness      : 0 
    -------------------

04:23.2N : start NSF
    NSF_IO - Neural Source Filter (I/O) (v1.0.0-Stable)

    Linguistic feature (duration)       : 5 [msec]
    Linguistic feature (acoustic)       : 279 [msec]
    Separate feature                    : 289 [msec]
    Synthesis (NSF)                     : 344 [msec]
    Error: Failed to run NSF. Please check log (NSF/NSF.log). 
05:15 : END

执行到最后一步NSF时出现了问题,手动替换变量尝试重新执行

sistine:NEUTRINO rumia$ ./bin/NSF_IO score/label/full/sample1.lab score/label/timing/sample1.lab output/sample1.f0 output/sample1.mgc output/sample1.bap KIRITAN output/sample1_nsf.wav -t
    NSF_IO - Neural Source Filter (I/O) (v1.0.0-Stable)

    Linguistic feature (duration)       : 0 [msec]
    Linguistic feature (acoustic)       : 239 [msec]
    Separate feature                    : 251 [msec]
    Synthesis (NSF)                     : 310 [msec]
    Write wav                           : 160424 [msec]
    Finish                              : 160666 [msec]
    Generation rate                     : 0.268881 [gen/sec]
    -- File and Parameter information --
    label length     	: 129 [line]
    wav length       	: 43.2 [sec] 
    frame period     	: 5 [frame]
    full_label       	: score/label/full/sample1.lab 
    timing_label     	: score/label/timing/sample1.lab 
    input f0         	: output/sample1.f0 
    input mgc        	: output/sample1.mgc 
    input bap        	: output/sample1.bap 
    nsf directory    	: NSF/ 
    output f0        	: NSF/output/f0/ 
    output mgc       	: NSF/output/mgc/ 
    output bap       	: NSF/output/bap/ 
    output list      	: NSF/output/wav.list 
    output wav       	: output/sample1_nsf.wav 
    ------------

成功。现在合成的最终结果已经输出到了output/sample1_nsf.wav。效果非常好,接近人声。

编辑乐谱

可以使用MuseScore编辑乐谱,然后将乐谱放到score,同样修改Run.shBASENAME,重新执行即可。


  1. 东北切蒲英 - 萌娘百科 ↩︎

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值