pandas
文章平均质量分 69
hurt--
这个作者很懒,什么都没留下…
展开
-
pandas 的学习 与 基本使用
1.介绍是什么pandas是一个强大的Python数据分析的工具包,它是基于NumPy构建的。关于NumPy,参考这里。主要功能具备对齐功能的数据结构DataFrame、Series集成时间序列功能提供丰富的数学运算和操作灵活处理缺失数据安装pip install pandas引用import pandas as pdSeriesSeries是一种类似于一维数组的对象,由一组数据和一组与之相关的数...原创 2018-02-08 09:31:37 · 1131 阅读 · 0 评论 -
教程 | 简单实用的pandas技巧:如何将内存占用降低90%
pandas 是一个 Python 软件库,可用于数据操作和分析。数据科学博客 Dataquest.io 发布了一篇关于如何优化 pandas 内存占用的教程:仅需进行简单的数据类型转换,就能够将一个棒球比赛数据集的内存占用减少了近 90%,机器之心对本教程进行了编译介绍。当使用 pandas 操作小规模数据(低于 100 MB)时,性能一般不是问题。而当面对更大规模的数据(100 MB 到数 G...原创 2018-03-10 13:16:43 · 4836 阅读 · 0 评论 -
轻松入门 学习 pandas
官方 10 分钟入门文档(http://pandas.pydata.org/pandas-docs/stable/10min.html)这是 pandas 的简短介绍,主要面向新用户。你可以看到更复杂的文档Cookbook(http://pandas.pydata.org/pandas-docs/stable/cookbook.html#cookbook)[toc]Environmentpanda...原创 2018-03-29 11:27:10 · 318 阅读 · 0 评论 -
pandas 进阶 --- 去重 合并 与实战
1.去重1.1 groupbygroupby用于对pandas数据进行分组,使用示例如下:card_group=card_df.groupby(['id','how'])['amount'].sum()首先我们根据id和how两列对数据进行分组,并对分组结果中的amount列进行求和运算,返回最后的结果。1.2 pivot_tablepivot_table是pandas提供的透视表函数,它根据一个...原创 2018-04-12 20:06:02 · 20667 阅读 · 1 评论 -
Pandas-Series知识点总结
1、Series创建根据listpandas有两种主要的数据结构,第一种是Series,是一种类似于一维数组的数据结构,它由一组数据以及一组与之相关的数据标签组成。我们可以直接根据list来生成一个Series。obj = pd.Series([4,7,-5,3])obj#输出0 41 72 -53 3dtype: int64可以通过index和values属...原创 2018-04-13 17:49:05 · 554 阅读 · 1 评论