pandas入门——DataFrame

DataFrame

  • 获取数据
# 打印数据的前五行
print(df.head())

# 打印数据的后五行
print(df.tail())
  • 选取一列
# 选取一列

print(df["height"])

# 数据类型是<class 'pandas.core.series.Series'>
print(type(df["weight"]))
  • 增加一列
df["new_column"] = 0
df["height_weight"] = df["height"] + df["weight"]
print(df.head())

第一行代码增加一列后,在数据框中该列的数据全部为0;第二行代码增加一列后该列的数据为对应的列相加后的值

  • 删除一列
df.pop("new_column")

print(df.head())

删除一列后,该列在数据框中整列被删除掉

  • 获取数据框的索引
print(df.index)
print(df.columns)
print(df.shape)
print(df.dtypes)

print—>:
RangeIndex(start=0, stop=3922, step=1)
Index([‘序号’, ‘Player’, ‘height’, ‘weight’, ‘collage’, ‘born’, ‘birth_city’,
‘birth_state’],
dtype=’object’)
(3922, 8)
序号 int64
Player object
height float64
weight float64
collage object
born float64
birth_city object
birth_state object
dtype: object

index索引:表示从0开始到3922结束,步进值为1
columns行:获取所有的列名
shape:获取数据框的行数与列数
dtypes:获取数据框每一列的数据类型

  • 替换None值
df_new = df.fillna(-1)
print(df.head())
print(df_new.head())

在有些数据框中会存在一些None值,这并不有利于我们对数据进行处理,所以进行替换是有必要的。这里需要注意的是fillna并不会对原有数据框进行替换而是返回一个新的替换后的数据框对象

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值