源文章地址:百度副总裁王海峰:百度在NLP领域都做了什么?
1.百度的应用
百度研发了知识图谱,通过分析用户的query、分析篇章、分析情感,构建了问答系统、对话系统和机器翻译。NLP技术应广泛应用于搜索、广告、o2o、Feed等。
2.知识图谱
百度的知识图谱分为三类:实体图谱(entity graph—如Neo4j就属于实体图谱)、关注点图谱(attention graph)和意图图谱(intent graph)。
3.语言理解
Query理解
query理解可以通过 依存句法分析 和 语义理解的方式实现。语义理解技术不仅仅是字面匹配,还可以实现语义级的搜索。
基于深度学习的语义理解技术,能够更好地获取到用户的语义。
篇章理解
用户获取信息的另一个重要渠道就是Feed,里面的咨询都是个性化的。
通常,文档会被打上各种各样的标签,如主题、话题、实体。
主题、话题、实体标签相互融合,形成关注点标签图谱。
情感分析
情感分析技术也称为“观点挖掘”(opinion mining),用来分析用户对各种事物的观点、情绪、看法等。
像在地图中搜索酒店,可以查看“酒店评价”,评价最上方,一般会有标签级的“观点摘要”,有的还存在句子级的观点摘要。这些东西都是从用户的评论中提炼出来的,能够表现用户态度的内容。