datawhale数据分析学习day03

这篇博客介绍了Pandas库中DataFrame对象的创建、操作和分析。包括使用np.arange创建二维数组,设置索引列和行,数据排序以及统计计算如升序、降序排列,两列数据相加,以及统计描述如平均值、标准差、四分位数等。此外,还提到了DataFrame相加产生NaN的情况。内容适合数据处理和分析初学者。
摘要由CSDN通过智能技术生成

day03:数据基本操作

*创建DataFrame对象

pd.DataFrame()

*生成二维数组

np.arange(8).reshape((2, 4))

*DataFrame对象的索引列

index=['2, 1] 

*DataFrame对象的索引行

columns=['d', 'a', 'b', 'c']

*数据升序(和降序)

frame.sort_values(by='c', ascending=True)

*根据行索引升序排列

frame.sort_index()

*根据列索引升序排列

frame.sort_index(axis=1)

*让任选两列数据同事降序排列

frame.sort_values(by=['a', 'c'], ascending=False)

*求两列相加最大值

max(text['兄弟姐妹个数'] + text['父母子女个数'])

*一列数据的基本情况

count : 样本数据大小
mean : 样本数据的平均值
std : 样本数据的标准差
min : 样本数据的最小值
25% : 样本数据25%的时候的值
50% : 样本数据50%的时候的值
75% : 样本数据75%的时候的值
max : 样本数据的最大值

关于教程中的需要注意的点:

*两个DataFrame相加后,会返回一个新的DataFrame,对应的行和列的值会相加,没有对应的会变成空值NaN。

 

本次的学习基于datawhale学习打卡小组:

链接:https://github.com/datawhalechina/hands-on-data-analysis

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值