![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
2017年度
miniAI学堂
人工智能 学习与分享
展开
-
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:01 WIN 7 Anaconda python 3.5 NLTK 安装配置
安装Anaconda安装NLTK安装Anaconda下载Anaconda 中 支持python 3.5(WIN 7)版本(本人桌面系统环境)地址:https://repo.continuum.io/archive/文件:https://repo.continuum.io/archive/Anaconda3-4.2.0-Windows-x86_64.exe修改Anaconda中的Ju...原创 2019-01-11 19:15:31 · 554 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:05 特征工程和NLP算法
05 特征工程和NLP算法5.1 理解特征工程5.1.1 特征工程的定义5.1.2 特征工程的目的5.1.3 一些挑战5.2 NLP中的基础特征5.2.1 句法解析和句法解析器5.2.2 词性标注和词性标注器理解词性标注和词性标注器的概念一步步开发词性标注器即插即用现有词性标注器使用词性标注作为特征挑战5.2.3 命名实体识别NER类Stanford NERSpacy NER提取和理解特征挑战5....原创 2019-01-29 17:24:00 · 1052 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:12 安装指导
12 安装指导12.1 安装Python、pip和NLTK12.2 安装PyCharm开发环境12.3 安装依赖库12.4 框架安装指导12.5 解决你的疑问12.6 总结本附录为您提供了有关安装Python库、单节点Hadoop集群和单节点Spark集群的信息。如果你想问我有关这本书的问题或任何与NLP有关的问题,你可以加入我的Gitter。12.1 安装Python、pip和NLTKpi...原创 2019-02-04 09:32:36 · 3981 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:11 如何提高你的NLP技能
11 如何提高你的NLP技能11.1 开始新的NLP职业生涯11.2 备忘列表11.3 确定你的领域11.4 通过敏捷的工作来实现成功11.5 NLP和数据科学方面一些有用的博客11.6 使用公开的数据集11.7 数据科学领域需要的数学知识11.8 总结本附录将为您提供更多关于如何提高NLP技能的信息。这也将帮助您更新您的知识。11.1 开始新的NLP职业生涯如果你是一名编码员,想要在NLP...原创 2019-02-04 09:31:29 · 424 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:10 高级工具
10 高级工具10.1 使用Apache Hadoop作为存储框架10.2 使用Apache Spark作为数据处理框架10.3 使用Apache Flink作为数据实时处理框架10.4 Python中的可视化类库本附录重点介绍如何在NLP应用程序中使用各种框架。我们将查看这些框架的概述,并介绍它们的基本特性以及它们为您做了什么。我们不会看到每个框架的详细架构。这里,目的是让您了解可以一起用于构...原创 2019-02-04 09:30:08 · 918 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:09 NLU和NLG问题中的深度学习
09 NLU和NLG问题中的深度学习9.1 人工智能概览9.1.1 人工智能的基础9.1.2 人工智能的阶段9.1.3 人工智能的种类9.1.4 人工智能的目标和应用9.2 NLU和NLG之间的区别9.2.1 自然语言理解9.2.2 自然语言生成9.3 深度学习概览9.4 神经网络基础9.4.1 神经元的第一个计算模型9.4.2 感知机9.4.3 理解人工神经网络中的数学概念9.5 实现神经网络9...原创 2019-02-04 09:28:49 · 2261 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:08 自然语言处理中的机器学习方法
08 自然语言处理中的机器学习方法8.1 机器学习的基本概念8.1.1 ML类型8.1.2 ML 监督学习8.1.3 无监督学习8.1.4 强化学习8.2 自然语言处理应用的开发步骤8.2.1 第一次迭代时的开发步骤8.2.2 从第二次到第N次迭代的开发步骤8.3 机器学习算法和其他概念8.3.1 有监督机器学习方法逻辑回归决策树随机森林朴素贝叶斯支持向量机8.3.2 无监督机器学习方法k-均值聚...原创 2019-02-03 12:06:18 · 2787 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:07 规则式自然语言处理系统
07 规则式自然语言处理系统7.1 规则式系统7.2 规则式系统的目的7.2.1 为何需要规则式系统7.2.2 使用规则式系统的应用7.2.3 练习7.2.4 开发规则式系统需要的资源7.3 规则式系统的架构7.3.1 从专家系统的角度来看规则式系统的通用架构7.3.2 NLP应用中的规则式系统的实用架构7.3.3 NLP应用中的规则式系统的定制架构7.3.4 练习7.3.5 Apache UIM...原创 2019-02-01 10:41:13 · 2806 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:04 预处理
03 预处理4.1 处理原始语料库文本4.1.1 获取原始文本4.1.2 小写化转换4.1.3 分句4.1.4 原始文本词干提取4.1.5 原始文本词形还原4.1.6 停用词去除4.2 处理原始语料库句子4.2.1 词条化4.2.2 单词词形还原4.3 基础预处理4.3.1 正则表达式4.3.2 基本级正则表达式4.3.3 高级正则表达式4.4 实践和个性化预处理4.4.1 由你自己决定4.4.2...原创 2019-01-27 10:09:23 · 976 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:03 理解句子的结构
03 理解句子的结构3.1 理解NLP的组成3.1.1 自然语言理解3.1.2 自然语言生成3.1.3 NLU和NLG的区别3.1.4 NLP的分支3.2 上下文无关文法3.3 形态分析3.3.1 形态学3.3.2 词素3.3.3 词干3.3.4 形态分析3.3.5 词3.3.6 词素的分类3.3.7 词干和词根的区别3.4 词法分析3.4.1 词条3.4.2 词性标注3.4.3 导出词条的过程3...原创 2019-01-26 10:59:27 · 832 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:02 语料库和数据集
什么是语料库?为什么我们需要语料库?理解语料库分析?什么是语料库?在语料库中,大数据集合可以采用以下格式:文本数据,意思是书面材料语音数据,即语音材料语料库有三种类型:单语语料库:这种语料库只有一种语言双语语料库:这种语料库有两种语言多语言语料库:这种语料库有多种语言例如:谷歌图书NGRAM语料库布朗语料库美国国家语料库为什么我们需要语料库?创建语料库的挑战...原创 2019-01-11 15:37:33 · 1273 阅读 · 0 评论 -
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:06 高级特征工程和NLP算法
06 高级特征工程和NLP算法6.1 词嵌入6.2 word2vec基础6.2.1 分布语义6.2.2 定义word2vec6.2.3 无监督分布语义模型中的必需品6.3 word2vec模型从黑盒到白盒6.3.1 基于分布相似性的表示6.3.2 了解word2vec模型的组件6.3.3 了解word2vec模型的逻辑6.3.4 了解word2vec模型背后的算法和数学6.3.5 关于word2v...原创 2019-01-31 09:38:54 · 2078 阅读 · 0 评论