pandas库入门之数据特征分析北理工嵩天老师python数据分析与展示单元8随堂笔记

最新推荐文章于 2023-01-02 09:02:37 发布

supreme_1

最新推荐文章于 2023-01-02 09:02:37 发布

阅读量438

点赞数

分类专栏： python数据分析

本文链接：https://blog.csdn.net/supreme_1/article/details/100657482

版权

这篇笔记介绍了Pandas库的数据排序，包括.sort_index()和.sort_values()方法，并探讨了数据的基本统计分析，如统计函数、累计统计和滚动计算。同时，文章讲解了数据的相关性分析，涉及协方差和Peason相关系数，以及如何衡量两个变量的相关程度。

摘要由CSDN通过智能技术生成

一组数据表达一个或多个含义
摘要：在数据形成过程中一些结果。即有损地提取数据特诊的过程
通过摘要我们能获得数据的：
* 基本统计（含排序）
* 分布/累计统计
* 数据特征(相关性，周期性等)
* 数据挖掘（形成知识）

.sort_index()方法在指定轴上根据索引进行排序，默认升序。
.sort_index(axis=0,ascending=True) ascending指递增排序。

import pandas as pd

import numpy as np

b = pd.DataFrame(np.arange(20).reshape(4,5),index=['c','a','d','b'])
b

c=b.sort_index()  #默认在0轴进行操作
c

c=c.sort_index(axis=1 ,ascending=False)
c

**.sort_values()方法在指定轴上根据数值进行排序，默认升序。
Series.sort_values(axis=0,ascending=True)
DataFrame.Sort_values(by,axis=0,ascending=True)
by: axis轴上的某个索引或索引列表

c = b.sort_values(2,ascending=False) #按第二列数据降序排列
c

关注

专栏目录

pandas库入门之数据特征分析 北理工嵩天老师python数据分析与展示 单元8随堂笔记