Pandas相关函数
文章平均质量分 50
Pandas相关函数的介绍
卷心菜L
怎一个菜字了得
展开
-
pandas 之 axis
删除某一行df.drop(index, axis=0)删除某一列df.drop(col_name, axis=1)按列求和df.sum(axis=0)按行求和df.sum(axis=1)例子df = DataFrame( np.array([[1,2,3,4],[5,6,7,8]]), index = ['1st','2nd'], columns = ['a','b','c','d'] )# 按列求和df.sum(axis=0)# 按行求和df.sum(ax原创 2022-02-22 20:11:17 · 473 阅读 · 0 评论 -
nlargest 按列排序取最大前n行
DataFrame.nlargest(n, columns, keep='first')作用:返回按指定列降序排列的前 n 行。按降序返回列中具有最大值的前 n 行。未指定的列也会返回,但不用于排序。此方法等效于 df.sort_values(columns, Ascending=False).head(n),但性能更高。参数解析:n:需要返回的行数。columns:取值可为一个列名,或列名列表。指定排序的列keep:取值可为:first,last,all,默认为 first。有重复值的原创 2021-12-22 21:06:52 · 541 阅读 · 0 评论 -
corr 计算相关性
DataFrame.corr(method='pearson', min_periods=1)作用:计算列的成对相关性,不包括 NA 和 bull 值,返回相关系数矩阵。相关系数的绝对值越大,相关性越强:相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。参数解析:method:{‘pearson’, ‘kendall’, ‘spearman’} or callablepearson:皮尔逊相关系数,也叫标准相关系数。 pearson相关系数衡量的是线性相关关系。若r=0,原创 2021-12-22 17:12:45 · 3036 阅读 · 0 评论 -
sample 随机抽取样本
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None, ignore_index=False)作用: 随机抽取样本参数介绍: n:随机抽取的样本数,不能与 frac 一起使用。 frac:随机抽取的样本数所占的百分比。例如:抽取总样本的20%,frac=0.2。 replace:是否可对同一行进行多次采用,即有放回的采样。 weights:样本权重,自动原创 2021-12-22 16:01:30 · 1165 阅读 · 0 评论