自然语言处理笔记9-哈工大关毅

最新推荐文章于 2019-03-03 19:07:07 发布

Big_quant

最新推荐文章于 2019-03-03 19:07:07 发布

阅读量796

点赞数 2

分类专栏：深度学习文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lvsehaiyang1993/article/details/86479461

版权

深度学习专栏收录该内容

60 篇文章 7 订阅

订阅专栏

目录

文章目录

目录
前言
课堂总结（一）
课堂总结（二）
课堂总结（三）
课堂总结（四）

前言

硕士生涯结束，开始专心做一件自己觉得有用的工具，先做工程，后搞理论。
自然语言处理是一个非常难的问题，同时是人工智能皇冠上的明珠。
接下来会记录一系列自然语言处理的笔记，来自于哈工大老师关毅。

课堂总结（一）

问答系统总结，数据层，搜索引擎控制，信息采集，文本分类，信息索引。
在这里插入图片描述

课堂总结（二）

文本分类系统新的结构。国家863项目。
处理精度，鲁棒性达到相应的目标。
新一代学习检索机制，持续学习的能力。
统计词法分析，外界反馈来学习，机制研究。
实体信息抽取，电子病历信息抽取。电子健康。基于最大熵的识别系统，CRF模型。
transfer learning模型。句法分析，补偿学习，增量学习，主动式学习，在线学习，强化学习。
文本聚类，自组织映射文本系统。
做一个有人用的东西。

课堂总结（三）

把自己做的东西的应用率作为自己的追求目标，忠实的fans。
领域知识的自动构建，单词变体，缩略语的研究，难度极大，非常有用的应用。
mindmanager 推荐。
思维导图构成，结构清晰，思路连贯。
开始回顾：
语言-多类文档。字处理-编码，输入输出。
分词的难点：every great idea is simple。
频度统计，很多工作。科学的定量方法。
语料库的多级加工，n-grams语言模型。
在这里插入图片描述

课堂总结（四）

n-gram噪声信道模型，平滑。
平滑的原则。
隐码句法浅层句法分析问题。
总结的话：规则+统计结合的思想。
一般性问题和特殊性问题。语义不能这么弄。
分个类：
1抢占高地的研究，先做式。
2解决问题的研究，Hownet。
3填补空白的研究，成熟方法+新事物处理，语义信息在神经中的机制。

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。