1. 为什么这门课叫人类语言处理而不叫自然语言处理?
传统的大多数自然语言处理课程超过百分之90的内容都是在讲如何解决文本(文字)相关的问题,而李老师这门课即讲如何解决语音相关问题又讲解决文本相关的问题。
2. 人类语言处理主要解决的问题?
主要解决的问题可以归结为六大类:
1:训练一个模型输入一个语音,输出一个语音。典型应用场景:
人机对话:语音内容分离:输入多个人一起说话的语音输出多组,每组为分离出的一个人的声音;同声传译:输入一个语音输出翻译后的语音等。
2:训练一个模型输入一个语音,输出一段文本。典型的应用场景:
视频字幕自动生成;语音关键词识别,提取出语音的关键词以触发系统的一些功能。
3:训练一个模型输入一个语音,输出语音的类别。
4:训练一个模型输入一段文本,输出一段语音。
5:训练一个模型输入一段文本,输出一段文本。典型的应用:
机器翻译,聊天机器人,任务型对话,关系抽取,问答式机器人等。
6:训练一个模型输入一段文本,输出文本的类别。典型的应用场景:
文本情感分类,文本主题分类等。
7:如何将元学习技术,知识图谱等新技术应用到人类语言处理的任务上。