rasa良好的语料举一反三能力和类别平衡机能使得我们不需要构建大量语料同样能得到较好的训练效果,近期学习rasa,在构思rasa语料的时候,总结了一些方法,意在根据rasa的特点语料简约化,为自己以后的开发和应用提供技术指导。
句子结构分析 | 句子成分分析 | 情感分析 |
主、系、表 | 感叹句 | 恐慌 |
主、谓、宾 | 陈述句 | 厌烦 |
主、谓 | 疑问句 | 疑虑 |
主、谓、宾、补 | 祈使句 | 惊喜 |
谓 | 其他 | 悲伤 |
其他 | 平淡/其他 |
上述三类共有:6*5*6=180
180种语料类型,原则上在rasa语料库中,每个意图最多180句语料即可
举例分析:
从句子属性分析考虑:主谓-疑问句-疑虑,再构造语料
语料:问路:
句子 | 结构所属 | 成分所属 | 情感所属 |
请问东华大街怎么走? | 主、谓 |