day03:数据基本操作
*创建DataFrame对象
pd.DataFrame()
*生成二维数组
np.arange(8).reshape((2, 4))
*DataFrame对象的索引列
index=['2, 1]
*DataFrame对象的索引行
columns=['d', 'a', 'b', 'c']
*数据升序(和降序)
frame.sort_values(by='c', ascending=True)
*根据行索引升序排列
frame.sort_index()
*根据列索引升序排列
frame.sort_index(axis=1)
*让任选两列数据同事降序排列
frame.sort_values(by=['a', 'c'], ascending=False)
*求两列相加最大值
max(text['兄弟姐妹个数'] + text['父母子女个数'])
*一列数据的基本情况
count : 样本数据大小
mean : 样本数据的平均值
std : 样本数据的标准差
min : 样本数据的最小值
25% : 样本数据25%的时候的值
50% : 样本数据50%的时候的值
75% : 样本数据75%的时候的值
max : 样本数据的最大值
关于教程中的需要注意的点:
*两个DataFrame相加后,会返回一个新的DataFrame,对应的行和列的值会相加,没有对应的会变成空值NaN。
本次的学习基于datawhale学习打卡小组:
链接:https://github.com/datawhalechina/hands-on-data-analysis