电脑也需要知道语法, 因此开发了 短语结构规则 来代表语法规则
专家把用户可能会说的话, 和机器人应该回复什么写成上百个规则, 这个很难维护.
现在的机器人用上 GB的真人聊天数据 来训练机器人
贝尔实验室在 1952年瑞出了第一个语音识别系统, 但那时候识别速度太慢了, 没有手写的快.
图谱: 横轴是时间 纵轴是频率
颜色越亮, 那个频率的声音越大.
波形到声音的转换, 用的 快速傅叶变换(FFT)
就像 音箱的 EQ可视化器
这个标出的高峰 叫 共振峰
这些单词的构成片段, 叫 音素