qq_42189426-CSDN博客

原创 keras.datasets.imdb.py 源码分析

keras.datasets.imdb.py 源码分析概述load_data方法源码：get_word_index方法：概述IMDB 数据集：包含来自互联网电影数据库（IMDB）的 50 000 条严重两极分化的评论。数据集被分为用于训练的 25 000 条评论与用于测试的 25 000 条评论，训练集和测试集都包含 50% 的正面评论和 50% 的负面评论。imdb.py 实现了IMDB ...

2019-06-03 17:40:27 831

《Python深度学习》2018中文版+PDF+源码

2018年 8 月第 1 版 2018年 8 月北京第1次印刷第 1 章介绍人工智能、机器学习和深度学习的重要背景知识。第 2 章介绍从事深度学习必须了解的基本概念：张量、张量运算、梯度下降和反向传播。这一章还给出了本书第一个可用的神经网络示例。第 3 章包括上手神经网络所需要了解的全部内容：Keras 简介，它是我们的首选深度学习框架；建立自己的工作站的指南；三个基本代码示例以及详细解释。读完这一章，你将能够训练简单的神经网络来处理分类任务和回归任务，你还将充分了解训练过程背后发生的事情。第 4 章介绍标准的机器学习工作流程。你还会了解常见的陷阱及其解决方案。第二部分将深入介绍深度学习在计算机视觉和自然语言处理中的实际应用。这一部分给出了许多示例，对于在现实世界的实践中遇到的深度学习问题，你可以用这些示例作为解决问题的模板。第 5 章介绍了一系列实用的计算机视觉示例，重点放在图像分类。第 6 章介绍了处理序列数据（比如文本和时间序列）的实用技术。第 7 章介绍了构建最先进深度学习模型的高级技术。第 8 章介绍了生成式模型，即能够创造图像和文本的深度学习模型，它有时会产生令人惊讶的艺术效果。第 9 章将帮你巩固在本书学到的知识，还会探讨深度学习的局限性及其未来的可能性。

2019-07-02

R语言实战+PDF+源码

本书的目的是让读者熟悉R平台，重点关注那些能马上应用到数据操作、可视化和理解的方法。全书共16章，分为4部分：“入门”、“基础方法”、“中级方法”和“高级方法”。在8个附录中还有更多的相关内容。第1章首先简要介绍了R，以及它作为数据分析平台的诸多特性。这一章主要介绍了R的获取，以及如何用网上的扩展包增强R基本安装的功能。另外，它还介绍了用户界面，以及如何以交互方式和批处理方式运行程序。第2章介绍了向R中导入数据的诸多方法。这一章的前半部分介绍了R用来存储数据的数据结构，以及如何用键盘输入数据。后半部分介绍了怎样从文本文件、网页、电子表格、统计软件和数据库向R导入数据。很多用户最初接触R都是为了绘制图形，我们在第3章会对此作介绍。这一章介绍了创建、修改图形的方法，以及如何将图形保存为各种格式的文件。第4章探讨了基本的数据管理，包括数据集的排序、合并、取子集，以及变量的转换、重编码和删除。在第4章的基础上，第5章涵盖了数据管理中函数（数学函数、统计函数、字符函数）和控制结构（循环、条件执行）的用法。然后我们介绍如何编写自己的R函数，以及如何用不同的方法整合数据。第6章演示了创建常见单变量图形的方法，例如柱状图、饼图、直方图、密度图、箱线图和点图。这些图形对于理解单变量的分布都很有用。第7章首先演示了如何总结数据，包括使用描述统计量和交叉表。然后，这一章介绍了用于分析两变量间关系的基本方法，包括相关性、t检验、卡方检验和非参数方法。第8章介绍了针对一个数值型结果变量与一系列数值型预测变量间的关系进行建模的回归方法，详细给出了拟合模型的方法、适用性评价和含义解释。第9章介绍了基于方差及其变体对基本实验设计的分析。此处，我们通常感兴趣的是处理方式的组合或条件对数值结果变量的影响。这一章还介绍了如何评价分析的适用性，以及如何可视化地展示分析结果。第10章详细介绍了功效分析。这一章首先讨论了假设检验，重点是如何判断在给定置信度的前提下需要多少样本才能判断处理的效果。这可以帮助我们安排实验和准实验研究来获得有用的结果。第11章扩展了第5章的内容，介绍了创建表现两个或多个变量间关系的图形。这包括各种2D 和3D的散点图、散点图矩阵、折线图、相关图和马赛克图。第12章介绍了一些稳健的数据分析方法，它们能处理比较复杂的情况，比如数据来源于未知或混合分布、有小样本问题、有恼人的异常值，或者依据理论分布设计假设检验非常复杂且在数学上难以处理的情况。这一章介绍的方法包括重抽样和自助法——很容易在R中实现的需要大量计算机资源的方法。第13章扩展了第8章中介绍的回归方法，分析非正态分布的数据。这一章首先介绍了广义线性模型，然后重点介绍了如何预测类别型变量（Logistic回归）或计数变量（泊松回归）。多元数据分析的一个难点是简化数据。第14章介绍了如何将大量的相关变量转换成较少的不相关变量（主成分分析），以及如何发现一系列变量中的潜在结构（因子分析）。这些方法涉及许多步骤，每一步都有详细的介绍。实际工作中面临的一个普遍问题是数据值缺失，第15章介绍了一个应对此问题的现代方法。 R中有很多简捷的方法可以用来分析因各种原因导致缺失而生成的不完整数据。这一章对一些好的方法都有介绍，还具体说明了在什么情况下应该用哪一种以及应该避免使用哪些方法。第16章介绍了R中最先进、最有用的数据可视化方法，包括用lattice图形表现非常复杂的数据，简要介绍新的ggplot2包，并对各种跟图形实时交互的方法做了综述。后记中介绍了一些优秀的网站，有助于读者进一步学习R、加入R社区、获得帮助，并及时获得R这个快速发展的软件的最新信息。最后的内容也很重要，8个附录（从A到H）扩展了正文的一些内容，包括R中的图形用户界面、自定义和升级R、导出数据到其他软件、创建出版级质量的输出、（像MATLAB一样）用R做矩阵计算，以及处理大型数据集。

2019-07-02

《Python机器学习经典实例》中文版pdf+英文版pdf+源码

Python机器学习经典实例 Python Machine Learning Cookbook 本书内容第1章介绍各种回归分析的监督学习技术。我们将学习如何分析共享自行车的使用模式，以及如何预测房价。第2章介绍各种数据分类的监督学习技术。我们将学习如何评估收入层级，以及如何通过特征评估一辆二手汽车的质量。第3章论述支持向量机的预测建模技术。我们将学习如何使用这些技术预测建筑物里事件发生的概率，以及体育场周边道路的交通情况。第4章阐述无监督学习算法，包括K-means聚类和均值漂移聚类。我们将学习如何将这些算法应用于股票市场数据和客户细分。第5章介绍推荐引擎的相关算法。我们将学习如何应用这些算法实现协同滤波和电影推荐。第6章阐述与文本数据分析相关的技术，包括分词、词干提取、词库模型等。我们将学习如何使用这些技术进行文本情感分析和主题建模。第7章介绍与语音数据分析相关的算法。我们将学习如何建立语音识别系统。第8章介绍分析时间序列和有序数据的相关技术，包括隐马尔可夫模型和条件随机场。我们将学习如何将这些技术应用到文本序列分析和股市预测中。第9章介绍图像内容分析与物体识别方面的算法。我们将学习如何提取图像特征，以及建立物体识别系统。第10章介绍在图像和视频中检测与识别面部的相关技术。我们将学习使用降维算法建立面部识别器。第11章介绍建立深度神经网络所需的算法。我们将学习如何使用神经网络建立光学文字识别系统。第12章介绍机器学习使用的数据可视化技术。我们将学习如何创建不同类型的图形和图表。

2019-05-15

《python机器学习基础教程》中文版pdf+源码

本书概览本书的结构大致如下。 • 第 1 章介绍机器学习的基本概念及其应用，并给出本书会用到的基本设置。 • 第 2 章和第 3 章介绍实践中最常用的机器学习算法，并讨论这些算法的优缺点。 • 第 4 章介绍在机器学习中待处理数据的呈现方式的重要性，以及应重点关注数据的哪些方面。 • 第 5 章介绍模型评估和调参的高级方法，重点讲解交叉验证和网格搜索。 • 第 6 章解释管道的概念。管道用于串联多个模型并封装工作流。 • 第 7 章介绍如何将前面各章讲述的方法应用到文本数据上，还介绍了一些文本特有的处理方法。 • 第 8 章对全书进行总结，还介绍了有关更高级主题的参考资料。第 1 章　引言.........................................................................................................................................1 1.1　为何选择机器学习 .....................................................................................................................1 1.1.1　机器学习能够解决的问题 ............................................................................................2 1.1.2　熟悉任务和数据 ............................................................................................................4 1.2　为何选择 Python.........................................................................................................................4 1.3 scikit-learn ..............................................................................................................................4 1.4　必要的库和工具 .........................................................................................................................5 1.4.1 Jupyter Notebook ............................................................................................................6 1.4.2 NumPy ............................................................................................................................6 1.4.3 SciPy ...............................................................................................................................6 1.4.4 matplotlib .....................................................................................................................7 1.4.5 pandas .............................................................................................................................8 1.4.6 mglearn ...........................................................................................................................9 1.5 Python 2 与 Python 3 的对比 .....................................................................................................9 1.6　本书用到的版本 .......................................................................................................................10 1.7　第一个应用：鸢尾花分类 .......................................................................................................11 1.7.1　初识数据 ......................................................................................................................12 1.7.2　衡量模型是否成功：训练数据与测试数据 ..............................................................14 1.7.3　要事第一：观察数据 ..................................................................................................15 1.7.4　构建第一个模型：k 近邻算法 ...................................................................................16 1.7.5　做出预测 ......................................................................................................................17 1.7.6　评估模型 ......................................................................................................................18 1.8　小结与展望 ...............................................................................................................................19 第 2 章　监督学习 ..............................................................................................................................21 2.1　分类与回归 ...............................................................................................................................21 2.2　泛化、过拟合与欠拟合 ...........................................................................................................22 2.3　监督学习算法 ...........................................................................................................................24 2.3.1　一些样本数据集 ..........................................................................................................25 2.3.2 k 近邻 ...........................................................................................................................28 2.3.3　线性模型 ......................................................................................................................35 2.3.4　朴素贝叶斯分类器 ......................................................................................................53 2.3.5　决策树 ..........................................................................................................................54 2.3.6　决策树集成 ..................................................................................................................64 2.3.7　核支持向量机 ..............................................................................................................71 2.3.8　神经网络（深度学习） ................................................................................................80 2.4　分类器的不确定度估计 ...........................................................................................................91 2.4.1　决策函数 ......................................................................................................................91 2.4.2　预测概率 ......................................................................................................................94 2.4.3　多分类问题的不确定度 ..............................................................................................96 2.5　小结与展望 ...............................................................................................................................98 第 3 章　无监督学习与预处理......................................................................................................100 3.1　无监督学习的类型 .................................................................................................................100 3.2　无监督学习的挑战 .................................................................................................................101 3.3　预处理与缩放 .........................................................................................................................101 3.3.1　不同类型的预处理 ....................................................................................................102 3.3.2　应用数据变换 ............................................................................................................102 3.3.3　对训练数据和测试数据进行相同的缩放 ................................................................104 3.3.4　预处理对监督学习的作用 ........................................................................................106 3.4　降维、特征提取与流形学习 .................................................................................................107 3.4.1　主成分分析 ................................................................................................................107 3.4.2　非负矩阵分解 ............................................................................................................120 3.4.3　用 t-SNE 进行流形学习 ............................................................................................126 3.5　聚类 .........................................................................................................................................130 3.5.1 k 均值聚类 .................................................................................................................130 3.5.2　凝聚聚类 ....................................................................................................................140 3.5.3 DBSCAN ....................................................................................................................143 3.5.4　聚类算法的对比与评估 ............................................................................................147 3.5.5　聚类方法小结 ............................................................................................................159 3.6　小结与展望 .............................................................................................................................159 第 4 章　数据表示与特征工程......................................................................................................161 4.1　分类变量 .................................................................................................................................161 4.1.1 One-Hot 编码（虚拟变量） .......................................................................................162 4.1.2　数字可以编码分类变量 ............................................................................................166 4.2　分箱、离散化、线性模型与树 .............................................................................................168 4.3　交互特征与多项式特征 .........................................................................................................171 4.4　单变量非线性变换 .................................................................................................................178 4.5　自动化特征选择 .....................................................................................................................181 4.5.1　单变量统计 ................................................................................................................181 4.5.2　基于模型的特征选择 ................................................................................................183 4.5.3　迭代特征选择 ............................................................................................................184 4.6　利用专家知识 .........................................................................................................................185 4.7　小结与展望 .............................................................................................................................192 第 5 章　模型评估与改进 ..............................................................................................................193 5.1　交叉验证 .................................................................................................................................194 5.1.1 scikit-learn 中的交叉验证 ....................................................................................194 5.1.2　交叉验证的优点 ........................................................................................................195 5.1.3　分层 k 折交叉验证和其他策略 .................................................................................196 5.2　网格搜索 .................................................................................................................................200 5.2.1　简单网格搜索 ............................................................................................................201 5.2.2　参数过拟合的风险与验证集 ....................................................................................202 5.2.3　带交叉验证的网格搜索 ............................................................................................203 5.3　评估指标与评分 .....................................................................................................................213 5.3.1　牢记最终目标 ............................................................................................................213 5.3.2　二分类指标 ................................................................................................................214 5.3.3　多分类指标 ................................................................................................................230 5.3.4　回归指标 ....................................................................................................................232 5.3.5　在模型选择中使用评估指标 ....................................................................................232 5.4　小结与展望 .............................................................................................................................234 第 6 章　算法链与管道 ...................................................................................................................236 6.1　用预处理进行参数选择 .........................................................................................................237 6.2　构建管道 .................................................................................................................................238 6.3　在网格搜索中使用管道 .........................................................................................................239 6.4　通用的管道接口 .....................................................................................................................242 6.4.1　用 make_pipeline 方便地创建管道 .........................................................................243 6.4.2　访问步骤属性 ............................................................................................................244 6.4.3　访问网格搜索管道中的属性 ....................................................................................244 6.5　网格搜索预处理步骤与模型参数 .........................................................................................246 6.6　网格搜索选择使用哪个模型 .................................................................................................248 6.7　小结与展望 .............................................................................................................................249 第 7 章　处理文本数据 ...................................................................................................................250 7.1　用字符串表示的数据类型 .....................................................................................................250 7.2　示例应用：电影评论的情感分析 .........................................................................................252 7.3　将文本数据表示为词袋 .........................................................................................................254 7.3.1　将词袋应用于玩具数据集 ........................................................................................255 7.3.2　将词袋应用于电影评论 ............................................................................................256 7.4　停用词 .....................................................................................................................................259 7.5　用 tf-idf 缩放数据 ..................................................................................................................260 7.6　研究模型系数 .........................................................................................................................263 7.7　多个单词的词袋（n 元分词） ................................................................................................263 7.8　高级分词、词干提取与词形还原 .........................................................................................267 7.9　主题建模与文档聚类 .............................................................................................................270 7.10　小结与展望 ...........................................................................................................................277 第 8 章　全书总结 ............................................................................................................................278 8.1　处理机器学习问题 .................................................................................................................278 8.2　从原型到生产 .........................................................................................................................279 8.3　测试生产系统 .........................................................................................................................280 8.4　构建你自己的估计器 .............................................................................................................280 8.5　下一步怎么走 .........................................................................................................................281 8.5.1　理论 ............................................................................................................................281 8.5.2　其他机器学习框架和包 ............................................................................................281 8.5.3　排序、推荐系统与其他学习类型 ............................................................................282 8.5.4　概率建模、推断与概率编程 ....................................................................................282 8.5.5　神经网络 ....................................................................................................................283 8.5.6　推广到更大的数据集 ................................................................................................283 8.5.7　磨练你的技术 ............................................................................................................284 8.6　总结 .........................................................................................................................................284

2019-05-15

《Python神经网络编程》中文pdf+英文pdf

神经网络是一种模拟人脑的神经网络，以期能够实现类人工智能的机器学习技术。本书揭示神经网络背后的概念，并介绍如何通过Python实现神经网络。全书分为3章和两个附录。第1章介绍了神经网络中所用到的数学思想。第2章介绍使用Python实现神经网络，识别手写数字，并测试神经网络的性能。第3章带领读者进一步了解简单的神经网络，观察已受训练的神经网络内部，尝试进一步改善神经网络的性能，并加深对相关知识的理解。附录分别介绍了所需的微积分知识和树莓派知识。本书适合想要从事神经网络研究和探索的读者学习参考，也适合对人工智能、机器学习和深度学习等相关领域感兴趣的读者阅读。第1章神经网络如何工作 1.1 尺有所短，寸有所长 1.2 一台简单的预测机 1.3 分类器与预测器并无太大差别 1.4 训练简单的分类器 1.5 有时候一个分类器不足以求解问题 1.6 神经元——大自然的计算机器 1.7 在神经网络中追踪信号 1.8 凭心而论，矩阵乘法大有用途 1.9 使用矩阵乘法的三层神经网络示例 1.10 学习来自多个节点的权重 1.11 多个输出节点反向传播误差 1.12 反向传播误差到更多层中 1.13 使用矩阵乘法进行反向传播误差 1.14 我们实际上如何更新权重 1.15 权重更新成功范例 1.16 准备数据第2章使用Python进行DIY 2.1 Python 2.2 交互式Python = IPython 2.3 优雅地开始使用Python 2.4 使用Python制作神经网络 2.5 手写数字的数据集MNIST 第3章趣味盎然 3.1 自己的手写数字 3.2 神经网络大脑内部 3.3 创建新的训练数据：旋转图像 3.4 结语

2019-05-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人