在深度学习时代如何用 HowNet 搞事情 | 讲座笔记

本文探讨了深度学习的特点和自然语言的表示,指出分布式表示的缺点。重点介绍了HowNet在融合义原知识的词义表示、神经语言模型、义原推荐和词典扩展中的应用,强调了HowNet在提升深度学习的可解释性和鲁棒性方面的潜力。
摘要由CSDN通过智能技术生成

本文时清华大学刘知远教授于 2018 年 5 月 26 日在中关村分享 HowNet 讲座时记录的笔记。
讲座详情:https://mp.weixin.qq.com/s/QyRGYU8-Fl4VcJFuUPhoTQ


一、深度学习特点
  • 分布式表示
  • 层次结构

二、自然语言的表示

自然语言包含从汉字到文档的多粒度语言单位,词汇、短语、句子、文档

  • 语义符号表示:词袋模型(one - hot)
    • 忽略了词复杂的语义关系,假定语言之间是正交的.
  • 深度学习时代,纯数据驱动方法,语义分布表示:word2vec
    • 每个词用向量表示,在大规模语料里,用相加的向量来预测新词,然后使得概率最大化.
    • 可以发现词与词的隐含关系.
    • 分布式表示的优势:解决大规模 NLP 的数据稀疏问题,实现跨领域和跨对象的知识迁移,提供多任务学习的统一底层表示
    • 能够将不同语言粒度的语言单位,提供统一的语义比空间表示

三、分布式表示的缺点
  • 可解释性差:几百维的向量表示词在空间中的位置,但是绝对位置没有意义,只有词的相对位置才有位置。用同样语料学习向量,同样词的位置可能是不一样的,但是相对位置是一样的,并且学习的位
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值