参加了两天百度AI训练营,简单记录一下学到的东西
一、知识图谱
知识图谱是让机器具有积累知识、运用知识的本领。
由于目前知识量很大,所以人工标注的方法无法满足,可以采用数据驱动、自底向上的方式自动构建通用知识图谱。
行业知识图谱不能用上述方法构建,还需要专家人机结合构建。
二、语音
近场识别(1米)已经很准,厂家通常声称98.7%,可以提高,但是没有必要。
远场需要设备支持,极限10米。
TTS通过Deep learning方式音库构建成本降低。
声纹存在漂移,分男女老幼比较靠谱。
中英文水平考试目前可以使用机器判别
三、NLP
语义表示:向量,CBOW方法简单有效,通过周围词表示
篇章知识获取百度特有
篇章表示:融合知识的多模态理解,例如视频标注谁在什么时间说的什么内容,视频自动标签