Python数据分析与展示-第四讲

最新推荐文章于 2023-02-05 15:59:54 发布

小张要努力i

最新推荐文章于 2023-02-05 15:59:54 发布

阅读量157

点赞数 1

文章标签：数据分析 python 数据挖掘

本文链接：https://blog.csdn.net/zj51351515/article/details/123006885

版权

Pandas数据特征分析

series类型：

DataFrame类型：

重新索引：

.reindex(index=None,columns=None,...)的参数

Pandas库的数据类型运算

自动补齐，缺项补NaN

fill_value参数替代NaN，替代后参与运算

不同维度间为广播运算，一维Series默认在轴1参与运算

使用运算方法可以令一维Series参与轴0运算

同维度运算，尺寸一致

不同维度，广播运算，默认在1轴

将一组数据通过摘要（有损地提取数据特征的过程）的方式，可以获得基本统计（含排序）、分布/累计统计、数据特征（相关性、周期性等）、数据挖掘（形成知识）。

Series.sort_values(axis=0, ascending=True)
DataFrame.sort_values(by, axis=0, ascending=True)     # by:axis轴上的某个索引或索引列表

两个事物，表示为X和Y，如何判断它们之间的存在相关性？

协方差

Pearson相关系数

r取值范围[-1, 1]

关注