机器学习尤其是深度学习在训练的时候需要大量的预料,下面介绍一个可以扩展预料的方法。
举个例子,对机器说一句:我想听有声读物。
这样类似的说法有很对,如:播放有声读物,帮我打开一下有声读物,请打开下有声读物。。。。
[我想|帮我|请](播[放]|打开)[一下|下]{app_name.有声读物|抖音}
我们用这样一个模块可以展开成下面72个意思相近的句子:
我想播一下[有声读物].(app_name)
我想播一下[抖音].(app_name)
我想播下[有声读物].(app_name)
我想播下[抖音].(app_name)
我想播放一下[有声读物].(app_name)
我想播放一下[抖音].(app_name)
我想播放下[有声读物].(app_name)
我想播放下[抖音].(app_name)
我想打开一下[有声读物].(app_name)
我想打开一下[抖音].(app_name)
我想打开下[有声读物].(app_name)
我想打开下[抖音].(app_name)
帮我播一下[有声读物].(app_name)
帮我播一下[抖音].(app_name)
帮我播下[有声读物].(app_name)
帮我播下[抖音].(app_name)
帮我播放一下[有声读物].(app_name)
帮我播放一下[抖音].(app_name)
帮我播放下[有声读物].(app_name)
帮我播放下[抖音].(app_name)
帮我打开一下[有声读物].(app_name)
帮我打开一下[抖音].(app_name)
帮我打开下[有声读物].(app_name)
帮我打开下[抖音].(app_name)
请播一下[有声读物].(app_name)
请播一下[抖音].(app_name)
请播下[有声读物].(app_name)
请播下[抖音].(app_name)
请播放一下[有声读物].(app_name)
请播放一下[抖音].(app_name)
请播放下[有声读物].(app_name)
请播放下[抖音].(app_name)
请打开一下[有声读物].(app_name)
请打开一下[抖音].(app_name)
请打开下[有声读物].(app_name)
请打开下[抖音].(app_name)
播一下[有声读物].(app_name)
播一下[抖音].(app_name)
播下[有声读物].(app_name)
播下[抖音].(app_name)
播放一下[有声读物].(app_name)
播放一下[抖音].(app_name)
播放下[有声读物].(app_name)
播放下[抖音].(app_name)
打开一下[有声读物].(app_name)
打开一下[抖音].(app_name)
打开下[有声读物].(app_name)
打开下[抖音].(app_name)
我想播[有声读物].(app_name)
我想播[抖音].(app_name)
我想播放[有声读物].(app_name)
我想播放[抖音].(app_name)
我想打开[有声读物].(app_name)
我想打开[抖音].(app_name)
帮我播[有声读物].(app_name)
帮我播[抖音].(app_name)
帮我播放[有声读物].(app_name)
帮我播放[抖音].(app_name)
帮我打开[有声读物].(app_name)
帮我打开[抖音].(app_name)
请播[有声读物].(app_name)
请播[抖音].(app_name)
请播放[有声读物].(app_name)
请播放[抖音].(app_name)
请打开[有声读物].(app_name)
请打开[抖音].(app_name)
播[有声读物].(app_name)
播[抖音].(app_name)
播放[有声读物].(app_name)
播放[抖音].(app_name)
打开[有声读物].(app_name)
打开[抖音].(app_name)
模版的规则是:
1.在"[]"里的内容是可有可无。
2.在"()"里的内容一定要有的
3."|"代表或的关系
4."{}"里面分别表示slot-key,slot-value
例如,[我想|帮我|请],展开后为“我想”或“帮我”或“请”或“none”(规则1,3)
(播[放]|打开),展开后为”播放“或“播”或“打开”(规则1,2,3)
{app_name.有声读物|抖音},展开后为“[有声读物].(app_name)或[抖音].(app_name)”,app_name表示slot-key,有声读物表示slot-value(规则3,4)
注意展开后的括号只是为了界定slot-key和slot-value的
最好把它们组合成一起。
代码实现戳这里