干货 | 自然语言处理入门资料推荐

微信公众号

关键字全网搜索最新排名

【机器学习算法】:排名第一

【机器学习】:排名第一

【Python】:排名第三

【算法】:排名第四

| AI深入浅出

最近几个月小编遨游在税务行业的智能问答调研和开发中,里面涉及到了很多的自然语言处理NLP的功能点。虽然接触NLP也有近两年的时间了,现在真正要应用到问答中,避免不了还是需要再重新熟识并深入研究理解。


下面是与NLP相关的一些书籍推荐、课件推荐和开源工具推荐。


主要是记录下入门的资料,由于资料的存储位置没有做规整,所以本文没有附带资源下载链接。如果有同学需要其中的资源,可以在公众号上给我留言,回头我把资源链接反馈给您。



部分开源工具和语料资源

1、NLTK官方提供的语料库资源列表

2、OpenNLP上的开源自然语言处理工具列表

3、斯坦福大学自然语言处理组维护的“统计自然语言处理及基于语料库的计算语言学资源列表” 

4、LDC上免费的中文信息处理资源



课件

1、哈工大刘挺老师的“统计自然语言处理”课件; 

2、哈工大刘秉权老师的“自然语言处理”课件;

3、中科院计算所刘群老师的“计算语言学讲义“课件; 

4、中科院自动化所宗成庆老师的“自然语言理解”课件; 

5、北大常宝宝老师的“计算语言学”课件;

6、北大詹卫东老师的“中文信息处理基础”的课件及相关代码; 

7、MIT大牛Michael Collins的“Machine Learning Approaches for Natural Language Processing(面向自然语言处理的机器学习方法)”课件; 

8、Michael Collins的“Machine Learning (机器学习)”课件; 

9、SMT牛人Philipp Koehn “Advanced Natural Language Processing(高级自然语言处理)”课件; 

10、Philipp Koehn “Empirical Methods in Natural Language Processing”课件; 

11、Philipp Koehn“Machine Translation(机器翻译)”课件。


书籍

1、《自然语言处理综论》英文版第二版 

2、《统计自然语言处理基础》英文版 

3、《用Python进行自然语言处理》,NLTK配套书 

4、《Learning Python第三版》,Python入门经典书籍,详细而不厌其烦 

5、《自然语言处理中的模式识别》

6、《EM算法及其扩展》 

7、《统计学习基础》 

8、《自然语言理解》英文版(似乎只有前9章) 

9、《Fundamentals of Speech Recognition》,质量不太好,不过第6章关于HMM的部分比较详细,作者之一便是Lawrence Rabiner; 

10、概率统计经典入门书:

《概率论及其应用》(英文版,威廉*费勒著) 第一卷  第二卷  DjVuLibre阅读器(阅读前两卷书需要) 

11、一本利用Perl和Prolog进行自然语言处理的介绍书籍:《An Introduction to Language Processing with Perl and Prolog》

12、国外机器学习书籍之: 

1) “Programming Collective Intelligence“,中文译名《集体智慧编程》,机器学习&数据挖掘领域”近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的” 

2) “Machine Learning“,机器学习领域无可争议的经典书籍,下载完毕将后缀改为pdf即可。

豆瓣评论 by 王宁):老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能”新”到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。 

3) “Introduction to Machine Learning” 


13、国外数据挖掘书籍之: 

1) “Data.Mining.Concepts.and.Techniques.2nd“,数据挖掘经典书籍。华裔科学家写的书,相当深入浅出。 

2) Data Mining:Practical Machine Learning Tools and Techniques 

3) Beautiful Data: The Stories Behind Elegant Data Solutions( Toby Segaran, Jeff Hammerbacher) 


14、国外模式识别书籍之: 

1)“Pattern Recognition” 

2)“Pattern Recongnition Technologies and Applications” 

3)“An Introduction to Pattern Recognition” 

4)“Introduction to Statistical Pattern Recognition” 

5)“Statistical Pattern Recognition 2nd Edition” 

6)“Supervised and Unsupervised Pattern Recognition” 

7)“Support Vector Machines for Pattern Classification” 


15、国外人工智能书籍之: 

1)Artificial Intelligence: A Modern Approach (2nd Edition) 人工智能领域无争议的经典。 

2)“Paradigms of Artificial Intelligence Programming: Case Studies in Common LISP” 


16、其他相关书籍: 

1)Programming the Semantic Web,Toby Segaran , Colin Evans, Jamie Taylor 

2)Learning.Python第四版,英文



加入微信机器学习交流

请添加微信:guodongwe1991

备注姓名-单位-研究方向


广告、商业合作

请添加微信:guodongwe1991

(备注:商务合作)

  • 0
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
18 智能问答系统调研 智能问答系统调研全文共30页,当前为第1页。智能问答系统调研全文共30页,当前为第1页。 智能问答系统调研全文共30页,当前为第1页。 智能问答系统调研全文共30页,当前为第1页。 中文问答系统调研报告 目录 问答系统调研报告 1 1 问答系统的价值体现 3 1.1 市场应用价值 3 1.2 弥补了搜索引擎的不足 3 1.3 总结 3 2 问答系统的市场应用情况 4 3 问答系统整体框架 5 3.1 问答实现流程 5 3.2 问句分析模块 6 3.2.1中文分词 6 3.2.2关键词提取 9 3.2.3关键词扩展 11 3.2.4实体识别 11 3.2.5问句分类 13 3.3 信息检索模块 14 3.3.1模式匹配 14 3.3.2答案检索 14 3.3.3知识图谱 17 3.4答案抽取模块 22 智能问答系统调研全文共30页,当前为第2页。智能问答系统调研全文共30页,当前为第2页。3.4.1基于规则的方法 22 智能问答系统调研全文共30页,当前为第2页。 智能问答系统调研全文共30页,当前为第2页。 3.4.2基于统计的方法 23 4 问答系统的应用场景 25 4.1 任务型 25 4.2 问答型 25 4.3 语聊型 26 5 调研总结 27 智能问答系统调研全文共30页,当前为第3页。智能问答系统调研全文共30页,当前为第3页。1 问答系统的价值体现 智能问答系统调研全文共30页,当前为第3页。 智能问答系统调研全文共30页,当前为第3页。 市场应用价值 问答系统是智能人机交互的技术基础,智能人机交互通过拟人化的交互体验逐步在智能客服、任务助理、智能家居、智能硬件、互动聊天等领域发挥巨大的作用和价值。因此,各大公司都将智能聊天机器人作为未来的入口级别的应用在对待。 包括Google、Facebook、Microsoft、Amazon、Apple等互联公司相继推出了自己的智能私人助理和机器人平台。 1.2 产品技术价值 搜索引擎的缺陷: 一方面,用户所输入的搜索关键词或关键句,无法真实反映用户需求;另一方面,检索系统仅仅通过几个关键词的简单逻辑组合来返回答案。两方面的误差造成检索结果很差。 检索结果不够简洁。冗余信息使用户难以快速准确定位所需信息,造成时间和精力的浪费。 缺乏对用户问句的语义理解。只靠关键词的索引或简单的匹配算法,并不能真正触及到问题的真实意思,使检索结果一般。 问答系统能针对搜索引擎缺陷的改进 问答系统允许用户以自然语言的形式询问或者输入。 问答系统能直接返回答案,提供给用户简洁、有效的答案。 问答系统能分析用户意图,提供给用户真正有用、准确的信息。 1.3 总结 无论是在日常生活中查阅资料,还是在科学研究、商业金融等领域的应用,都有智能问答的参与,所以智能问答的发展与管理将是人们不可忽视的研究方向。 2 问答系统的市场应用情况 按照市场应用情况可分为五类:在线客服,娱乐机器人,教育聊天机器人,个人助理和智能问答. (1) 在线客服 智能问答系统调研全文共30页,当前为第4页。智能问答系统调研全文共30页,当前为第4页。在线客服聊天机器人系统的主要功能是和用户 行基本沟通并自动回复用户有关产品或服务的问题,降低企业客服运营成本,提升用户体验.应用场景通常为网站首页和手机终端,代表有小爱机器人,JIMI(JD)客服机器人,JIMI具有一定的拒识能力,即能够知道自己不能回答用户的哪些问题以及何时应转向人工客服. 智能问答系统调研全文共30页,当前为第4页。 智能问答系统调研全文共30页,当前为第4页。 (2) 娱乐 娱乐机器人主要同用户进行开放主题的对话,从而实现对用户的精神陪伴,情感慰藉和心理疏导等作用,主要针对社交媒体,儿童玩具,代表产品有微软小冰和腾讯的小微,小微除了能够与用户进行开放主题的聊天外,还能提供特定主题的服务,如天气预报和生活常识等. (3) 教育 教育聊天机器人根据教育内容构建交互的语言使用环境,帮助用户学习某种语言,在学习某项专业课程时,指导用户逐步深入学习并掌握技能,用户的特定年龄阶段,帮助用户进行某种知识的辅助学习等.通常该类聊天机器人具备交互学习功能,培训软件及智能玩具等,代表有科大讯飞开心熊宝系列玩具. (4) 个人助理 该类聊天机器人主要通过语音或文字与聊天机器人系统进行交互,实现个人事务的查询及代办,如天气查询,空气质量查询,定位,短信收发,日程提醒和智能搜索等,从而更便捷辅助用户的日常事务处理,代表有Apple的Siri,Google Now, Cortana. (5) 智能问答 智能应答的聊天机器人主要功能包括以自然语言形式提出的事实型问题和需要计算和逻辑推理型的问题,已达到满足用户的信息需求及辅助用户进行决策的目的.代表有IBM wats

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值