数据科学 IPython 笔记本
数据科学 IPython 笔记本
绝不原创的飞龙
这个作者很懒,什么都没留下…
展开
-
数据科学 IPython 笔记本 翻译完成
原文:donnemartin/data-science-ipython-notebooks译者:飞龙协议:CC BY-NC-SA 4.0欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远。ApacheCN 机器学习交流群 629470233ApacheCN 学习资源在线阅读PDF格式EPUB格式MOBI格式代码仓库目录数据科学 IPython...翻译 2019-03-27 10:02:42 · 34517 阅读 · 0 评论 -
数据科学 IPython 笔记本 六、SciPy 统计推断
六、SciPy 统计推断原文:statistical-inference-scipy译者:飞龙协议:CC BY-NC-SA 4.06.1 效应量署名:派生于 Allen Downey 的 CompStats。协议:Creative Commons Attribution 4.0 International。from __future__ import print_functio...翻译 2019-03-26 16:49:42 · 35594 阅读 · 0 评论 -
数据科学 IPython 笔记本 四、Keras(下)
四、Keras(下)原文:keras-tutorials译者:飞龙协议:CC BY-NC-SA 4.04.7 用于 MNIST 的卷积网络致谢:派生于 Valerio Maggio 的 deep-learning-keras-tensorflow深度学习模型可能需要相当长的时间来运行,尤其是在不使用 GPU 的情况下。为了节省时间,你可以采样一个观测子集(例如 1000 个)...翻译 2019-01-23 22:12:19 · 34803 阅读 · 0 评论 -
数据科学 IPython 笔记本 四、Keras(上)
四、Keras(上)原文:keras-tutorials译者:飞龙协议:CC BY-NC-SA 4.04.1 深度学习导论致谢:派生于 Valerio Maggio 的 deep-learning-keras-tensorflow深度学习允许由多层组成的计算模型,来学习具有多个抽象级别的数据表示。这些方法极大地改进了语音识别,视觉对象识别,物体检测,以及药物发现和基因组学等许多...翻译 2019-01-23 22:11:39 · 35703 阅读 · 1 评论 -
数据科学 IPython 笔记本 一、TensorFlow
一、TensorFlow原文:TensorFlow Tutorials译者:飞龙协议:CC BY-NC-SA 4.01.1 TensorFlow 基本操作致谢:派生于 Aymeric Damien 的 TensorFlow 示例配置参考配置指南。import tensorflow as tf# 基本的常量操作# 由构造器返回的值# 表示常量操作的输出a = tf....翻译 2019-01-22 10:54:14 · 35662 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.15 高性能 Pandas
# 7.15 高性能 Pandas:eval()和query()原文:High-Performance Pandas: eval() and query()译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。我们在前面的章节中已经看到,PyData 技术栈的力量,建立在 NumPy 和 ...翻译 2019-01-14 11:11:37 · 34820 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.14 处理时间序列
7.14 处理时间序列原文:Working with Time Series译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。Pandas 是在金融建模的背景下开发的,正如你所料,它包含一组相当广泛的工具,用于处理日期,时间和时间索引数据。日期和时间数据有几种,我们将在这里讨论:时...翻译 2019-01-14 11:08:27 · 35712 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.13 向量化字符串操作
7.13 向量化字符串操作原文:Vectorized String Operations译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。Python 的一个优点是它在处理和操作字符串数据方面相对容易。Pandas 构建于此之上,并提供了一套全面的向量化字符串操作,它们成为处理(阅读“...翻译 2019-01-14 11:07:29 · 36383 阅读 · 2 评论 -
数据科学 IPython 笔记本 7.12 透视表
7.12 透视表原文:Pivot Tables译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。我们已经看到GroupBy抽象如何让我们探索数据集中的关系。透视表是一种类似的操作,常见于电子表格,和其他操作表格数据的程序中。透视表将简单的逐列数据作为输入,并将条目分组为二维表格,该表提...翻译 2019-01-14 11:06:25 · 35023 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.11 聚合和分组
7.11 聚合和分组原文:Aggregation and Grouping译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。大数据分析的必要部分是有效的总结:计算聚合,如sum(),mean(),median(),min()和max(),其中单个数字提供了大数据集的潜在本质的见解。在本...翻译 2019-01-14 11:04:57 · 35581 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.10 组合数据集:合并和连接
7.10 组合数据集:合并和连接原文:Combining Datasets: Merge and Join译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。Pandas 提供的一个基本特性,是内存中的高性能的连接和合并操作。如果你曾经使用过数据库,那么你应该熟悉这种类型的数据交互。它的...翻译 2019-01-14 11:02:10 · 35260 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.9 组合数据集:连接和附加
7.9 组合数据集:连接和附加原文:Combining Datasets: Concat and Append译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。一些最有趣的数据研究来自于不同的数据源的组合。这些操作可能涉及,从两个不同数据集的非常简单的连接,到更复杂的数据库风格的连接和...翻译 2019-01-14 11:00:59 · 35706 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.8 分层索引
7.8 分层索引原文:Hierarchical Indexing译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。到目前为止,我们主要关注一维和二维数据,分别存储在 Pandas Series和DataFrame对象中。通常,超出此范围并存储更高维度的数据(即由多于一个或两个键索引的数...翻译 2019-01-14 10:59:40 · 35458 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.7 处理缺失数据
7.7 处理缺失数据原文:Handling Missing Data译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。许多教程中的数据与现实世界中的数据之间的差异在于,真实世界的数据很少是干净和同构的。特别是,许多有趣的数据集缺少一些数据。为了使事情变得更复杂,不同的数据源可能以不同的...翻译 2019-01-13 21:57:07 · 35184 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.6 Pandas 中的数据操作
7.6 Pandas 中的数据操作原文:Operating on Data in Pandas译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。NumPy 的一个重要部分是能够执行快速的逐元素运算,包括基本算术(加法,减法,乘法等),和更复杂的运算(三角函数,指数函数和对数函数等)。P...翻译 2019-01-13 21:56:18 · 34750 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.5 数据索引和选择
7.5 数据索引和选择原文:Data Indexing and Selection译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。在第二章中,我们详细介绍了在 NumPy 数组中访问,设置和修改值的方法和工具。这些包括索引(例如,arr[2,1]),切片(例如,arr[:, 1:5]...翻译 2019-01-13 21:54:38 · 36054 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.4 Pandas 对象介绍
7.4 Pandas 对象介绍原文:Introducing Pandas Objects译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。在最基本的层面上,Pandas 对象可以认为是 NumPy 结构化数组的增强版本,其中行和列用标签而不是简单的整数索引来标识。我们将在本章的过程中看...翻译 2019-01-13 21:53:41 · 35424 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.3 Pandas 数据操作
7.3 Pandas 数据操作原文:Data Manipulation with Pandas译者:飞龙协议:CC BY-NC-SA 4.0本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。在前一章中,我们详细介绍了 NumPy 及其ndarray对象,它在 Python 中提供了密集类型数组的高效存储和操作。在这里,通过详细了解...翻译 2019-01-13 21:52:44 · 34927 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.2 数据整理
7.2 数据整理原文:Data Wrangling译者:飞龙协议:CC BY-NC-SA 4.0(原文协议:Apache License 2.0)数据流直接从 GitHub 挖掘数据,Viz由 GitHub API 提供支持,并利用以下内容:通过 Python 使用github3.py 访问 GitHub API。将下面的 IPython 笔记本 中的pandas用于数据整理...翻译 2019-01-13 21:50:34 · 35000 阅读 · 0 评论 -
数据科学 IPython 笔记本 7.1 Pandas
7.1 Pandas原文:Pandas译者:飞龙协议:CC BY-NC-SA 4.0致谢:这个笔记摘自 Wes McKinney 的著作 《Python 数据分析》(Python for Data Analysis)序列(Series)数据帧(DataFrame)重索引删除条目索引,选择和过滤算术和数据对齐函数应用和映射排序和排名带有重复值的轴索引汇总和计算描述性...翻译 2019-01-13 21:49:37 · 35138 阅读 · 1 评论 -
数据科学 IPython 笔记本 9.11 结构化数据:NumPy 的结构化数组
9.11 结构化数据:NumPy 的结构化数组本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。译者:飞龙协议:CC BY-NC-SA 4.0虽然我们的数据通常可以通过同构数组来很好地表示,但有时并非如此。 本节演示了 NumPy 结构化数组和记录数组的用法,它们为复合异构数据提供了有效的存储。 虽然这里展示的模式对于简单操作很有用...翻译 2019-01-05 14:18:28 · 35498 阅读 · 0 评论 -
数据科学 IPython 笔记本 9.10 数组排序
9.10 数组排序本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。译者:飞龙协议:CC BY-NC-SA 4.0到目前为止,我们主要关注使用 NumPy 访问和操作数组数据的工具。本节介绍与 NumPy 数组中的值的排序相关的算法。这些算法是计算机科学入门课程中最受欢迎的主题:如果你曾经上过这些课,你可能对插入排序,选择排序,归...翻译 2019-01-05 14:17:32 · 35103 阅读 · 0 评论 -
数据科学 IPython 笔记本 9.9 花式索引
9.9 花式索引本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。译者:飞龙协议:CC BY-NC-SA 4.0在前面的章节中,我们看到了如何使用简单的索引(例如,arr [0]),切片(例如,arr [:5])和布尔掩码来访问和修改数组的片段( 例如,arr [arr> 0])。在本节中,我们将介绍另一种数组索引方式,称为花...翻译 2019-01-05 14:16:41 · 35603 阅读 · 0 评论 -
数据科学 IPython 笔记本 9.8 比较,掩码和布尔逻辑
9.8 比较,掩码和布尔逻辑本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。译者:飞龙协议:CC BY-NC-SA 4.0本节介绍如何使用布尔掩码,来检查和操作 NumPy 数组中的值。当你想要根据某些标准,提取,修改,计算或以其他方式操纵数组中的值时,掩码会有所帮助:例如,你可能希望计算大于某个值的所有值,或者可能删除高于某些阈...翻译 2019-01-05 14:15:27 · 35630 阅读 · 0 评论 -
数据科学 IPython 笔记本 9.7 数组上的计算:广播
9.7 数组上的计算:广播本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。译者:飞龙协议:CC BY-NC-SA 4.0我们在上一节中看到,NumPy 的通用函数如何用于向量化操作,从而消除缓慢的 Python 循环。向量化操作的另一种方法是使用 NumPy 的广播功能。广播只是一组规则,用于在不同大小的数组上应用二元ufunc(...翻译 2019-01-05 14:14:34 · 34423 阅读 · 0 评论 -
数据科学 IPython 笔记本 9.6 聚合:最小、最大和之间的任何东西
9.6 聚合:最小、最大和之间的任何东西本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。译者:飞龙协议:CC BY-NC-SA 4.0通常,当面对大量数据时,第一步是计算相关数据的汇总统计信息。也许最常见的汇总统计数据是均值和标准差,它允许你汇总数据集中的“典型”值,但其他汇总也很有用(总和,乘积,中位数,最小值和最大值,分位数...翻译 2019-01-05 14:13:45 · 35600 阅读 · 0 评论 -
数据科学 IPython 笔记本 9.5 NumPy 数组上的计算:通用函数
9.5 NumPy 数组上的计算:通用函数本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。译者:飞龙协议:CC BY-NC-SA 4.0到目前为止,我们一直在讨论 NumPy 的一些基本要点;在接下来的几节中,我们将深入探讨 NumPy 在 Python 数据科学领域如此重要的原因。也就是说,它为数据数组的最优计算,提供了一个简...翻译 2019-01-05 14:12:57 · 36121 阅读 · 0 评论 -
数据科学 IPython 笔记本 9.4 NumPy 数组的基础
9.4 NumPy 数组的基础本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。译者:飞龙协议:CC BY-NC-SA 4.0Python 中的数据操作几乎与 NumPy 数组操作同义:即使是像 Pandas 这样的新工具也是围绕 NumPy 数组构建的。本节将介绍几个示例,使用 NumPy 数组操作来访问数据和子数组,以及拆分,...翻译 2019-01-05 14:11:46 · 35529 阅读 · 0 评论 -
数据科学 IPython 笔记本 9.3 理解 Python 中的数据类型
9.3 理解 Python 中的数据类型本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。译者:飞龙协议:CC BY-NC-SA 4.0数据驱动的科学和有效计算需要了解数据的存储和操作方式。本节概述了如何在 Python 语言本身中处理数据数组,以及对比 NumPy 如何改进它。对于理解本书其余部分的大部分内容,理解这种差异至关...翻译 2019-01-05 14:10:14 · 35694 阅读 · 0 评论 -
数据科学 IPython 笔记本 9.2 NumPy 简介
9.2 NumPy 简介本节是《Python 数据科学手册》(Python Data Science Handbook)的摘录。译者:飞龙协议:CC BY-NC-SA 4.0本章以及第三章概述了在 Python 中有效加载,存储和操作内存数据的技术。主题非常广泛:数据集可能来源于广泛的来源和各种格式,包括文档集合,图像集合,声音片段集合,数值测量集合或几乎任何其他内容。尽管存在这种...翻译 2019-01-05 14:09:17 · 35171 阅读 · 0 评论 -
数据科学 IPython 笔记本 9.1 NumPy
9.1 NumPy致谢:派生于 Olivier Grisel 分享的 scikit-learn 和 IPython 并行机器学习译者:飞龙协议:CC BY-NC-SA 4.0NumPy 数组,dtype和形状常见数组操作原地修改形状和更新合并数组创建示例数据import numpy as npNumPy 数组,dtype和形状a = np.array([1, 2, ...翻译 2019-01-05 14:07:58 · 34662 阅读 · 0 评论