pandas
文章平均质量分 95
绝不原创的飞龙
这个作者很懒,什么都没留下…
展开
-
NumPy 和 Pandas 数据分析实用指南:1~6 全
在本节中,我们将讨论什么是 Anaconda 以及为什么使用它。我们将提供一个链接,以显示从其赞助商 Continuum Analytics 的网站下载 Anaconda 的位置,并讨论如何安装 Anaconda。Anaconda 是 Python 和 R 编程语言的开源发行版。在本书中,我们将专注于 Anaconda 专门用于 Python 的部分。Anaconda 帮助我们将这些语言用于数据分析应用,包括大规模数据处理,预测分析以及科学和统计计算。原创 2023-04-13 14:24:01 · 1750 阅读 · 0 评论 -
Pandas 秘籍:6~11
原文:Pandas Cookbook协议:CC BY-NC-SA 4.0译者:飞龙六、索引对齐在本章中,我们将介绍以下主题:检查索引对象生成笛卡尔积索引爆炸用不相等的索引填充值追加来自不同数据帧的列突出显示每一列的最大值用方法链复制idxmax寻找最常见的最大值介绍当以某种方式组合多个序列或数据帧时,在进行任何计算之前,数据的每个维度会首先自动在每个轴上对齐。 轴的这种无声且自动的对齐会给初学者造成极大的困惑,但它为超级用户提供了极大的灵活性。 本章将深入探讨索引对象,然原创 2023-04-13 14:21:30 · 1584 阅读 · 0 评论 -
Pandas 秘籍:1~5
原文:Pandas Cookbook协议:CC BY-NC-SA 4.0译者:飞龙一、Pandas 基础在本章中,我们将介绍以下内容:剖析数据帧的结构访问主要的数据帧组件了解数据类型选择单列数据作为序列调用序列方法与运算符一起使用序列将序列方法链接在一起使索引有意义重命名行和列名称创建和删除列介绍本章的目的是通过彻底检查序列和数据帧数据结构来介绍 Pandas 的基础。 对于 Pandas 用户来说,了解序列和数据帧的每个组件,并了解 Pandas 中的每一列数据正好原创 2023-04-13 14:15:42 · 2325 阅读 · 0 评论 -
精通 Pandas:6~11
原文:Mastering Pandas协议:CC BY-NC-SA 4.0译者:飞龙六、处理缺失数据,时间序列和 Matplotlib 绘图在本章中,我们将介绍一些必要的主题,这些主题对于培养使用 Pandas 的专业知识必不可少。 这些主题的知识对于准备数据作为处理数据以进行分析,预测或可视化的程序或代码的输入非常有用。 我们将讨论的主题如下:处理缺失的数据处理时间序列和日期使用matplotlib绘图到本章结束时,用户应该精通这些关键领域。处理缺失的数据数据丢失是指由于某种原原创 2023-04-13 14:12:30 · 2272 阅读 · 0 评论 -
精通 Pandas:1~5
原文:Mastering Pandas协议:CC BY-NC-SA 4.0译者:飞龙一、Pandas 和数据分析简介在本章中,我们解决以下问题:数据分析的动机如何将 Python 和 Pandas 用于数据分析Pandas 库的描述使用 Pandas 的好处数据分析的动机在本节中,我们将讨论使数据分析成为当今快速发展的技术环境中日益重要的工作领域的趋势。我们生活在大数据世界中在过去两年中,术语大数据已成为最热门的技术流行语之一。 现在,我们越来越多地在各种媒体上听到有关大数据原创 2023-04-13 14:09:58 · 1705 阅读 · 0 评论 -
精通 Pandas 探索性分析:1~4 全
在本章中,我们学习了如何在 Pandas 中使用不同种类的数据集格式。我们学习了在导入 CSV 文件时如何使用 Pandas 提供的高级选项。我们还看到了如何使用 Excel 数据集,并且探讨了可用于处理各种数据格式(例如 HTML,JSON,PICKLE 文件,SQL 等)的方法。在下一章中,我们将学习如何在高级数据选择中使用 Pandas 技术。我们将使用zillow.com的真实数据集,这是一个在线房地产市场,其发布房价数据集是他们研究工作的一部分。这些数据集可在公共领域获得,并在归属于。原创 2023-04-13 14:06:50 · 1744 阅读 · 0 评论 -
Pandas 学习手册中文第二版:11~15
在本章中,我们研究了在一个或多个DataFrame对象中合并和重塑数据的几种技术。我们通过检查如何组合来自多个 Pandas 对象的数据来开始本章。然后,我们研究了如何沿行轴和列轴连接多个DataFrame对象。由此,我们随后研究了如何基于多个DataFrame对象中的值,使用 Pandas 执行类似于数据库的连接和数据合并。然后,我们研究了如何使用枢轴,堆叠和融合来重塑DataFrame中的数据。通过这一过程,我们看到了每个过程如何通过改变索引的形状以及将数据移入和移出索引来提供如何移动数据的多种变体。原创 2023-04-13 14:02:29 · 1531 阅读 · 0 评论 -
Pandas 学习手册中文第二版:6~10
在本章中,我们更深入地研究了在 Pandas 中使用索引来组织和检索数据。我们研究了许多有用的索引类型,以及它们如何与不同类型的数据一起使用以有效访问值而无需查询行中的数据。最后,我们对使用分层索引的研究进行了总结,该分层索引能够有效地检索与多个索引中的标签匹配的数据,从而为我们提供了选择数据子集的有力手段。至此,我们已经涵盖了 Pandas 的许多基本建模部分。在下一章中,我们将研究用 Pandas 表示分类变量。在本章中,我们研究了如何使用 pandas 类别对类别变量建模。原创 2023-04-13 14:00:03 · 1432 阅读 · 0 评论 -
Pandas 学习手册中文第二版:1~5
pandas 是一个 Python 库,其中包含高级数据结构和工具,这些数据结构和工具已创建来帮助 Python 程序员执行强大的数据分析。Pandas 的最终目的是帮助您快速发现数据中的信息,并将信息定义为基本含义。Wes McKinney 于 2008 年开始开发 Pandas。它于 2009 年开源。Pandas 目前受到各种组织和贡献者的支持和积极开发。最初设计 Pandas 时要考虑到财务问题,特别是它具有围绕时间序列数据操作和处理历史股票信息的能力。表示随着时间变化的安全数据,例如股票价格。原创 2023-04-13 13:56:59 · 4142 阅读 · 0 评论 -
告别痛苦,快乐学习Pandas!开源教程《Joyful-Pandas》发布
作者:耿远昊、Datawhale团队寄语:Pandas 是基于Numpy的一种工具,是为了解决数据分析任务而创建的,其纳入了大量库和一些标准的数据模型,提供了大量能使我们快速便捷地处理数据的函数和方法。Datawhale又一开源项目来了!Joyful-Pandas(顾名思义:快乐学习Pandas)由Datawhale成员耿远昊发起,作者结合了三份经典教材的学习经验,历时2个多月时间,结合...转载 2020-04-20 23:34:35 · 28637 阅读 · 0 评论