Pandas入门细谈:更好的数据清理
文章平均质量分 95
Cdccc_daye
这个作者很懒,什么都没留下…
展开
-
Pandas GroupBy计算剖析基础:分割、应用与组合
引言对较大数据进行分析时,有效的数据累计可以呈现大数据集的特征。由于数据集内部数据的多样性,我们不再形容为对单一类型数据的聚合,而是累计(aggregation),这意味着我们将实现在某个类别里的合并同类项。对于一维数据的和、最值、均值等系列统计指标在这里不再赘述。对于二维的,有组织的DataFrame你也能通过指定汇总轴轻松得到你想要的结果。笼统的了解整个数据集是不够的,对某些标签和索引局部的累计分析同样是我们需要的,Pandas里的groupby可以帮助我们做到这一点。但你在分组的时候,中间原创 2022-04-12 20:15:58 · 1260 阅读 · 0 评论 -
Pandas 索引对齐、缺失值
开篇当在进行Series、DataFrame这两个对象的二元运算时,有稍不同于Numpy的处理方式。本篇将以组合不同来源的数据为起点,探究其中发生的索引对齐,过程中产生的缺失值的特性和处理手段,以及更进一步的数据集合并方法。引子——Pandas的NumPy-based特性因为Pandas是建立在NumPy的基础之上的,所以NumPy的通用函数仍适用于Series对象和DataFrame对象。你可以在NumPy的通用函数里传入一个Series对象,会返回一个保留索引的Pandas对象。*下面代原创 2022-04-12 00:19:05 · 2196 阅读 · 0 评论