pandas

本文详细介绍了Pandas库,包括Series和DataFrame的操作,如数据清洗、插入、合并、删除、转换,以及保存读取文件。重点讲解了sort_values、sort_index、fillna、astype等常用函数的使用方法。
摘要由CSDN通过智能技术生成

import pandas as pd

Series

pd.Series( data, index, dtype, name, copy)
data:一组数据(ndarray 类型)。
index:数据索引标签,如果不指定,默认从 0 开始。
dtype:数据类型,默认会自己判断。
name:设置名称。
copy:拷贝数据,默认为 False

DataFrame

pd.DataFrame(data,index,columns,dtype,copy)
#data:一组数据(ndarray、series, map, lists, dict 等类型)。
#index:索引值,或者可以称为行标签。
#columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
#dtype:数据类型。
#copy:拷贝数据,默认为 False。
  • Pandas 可以使用 loc 属性返回指定行的数据,如果没有设置索引,第一行索引为 0,第二行索引为 1,以此类推:
data = {
   
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

# 数据载入到 DataFrame 对象
df = pd.DataFrame(data)

# 返回第一行
print(df.loc[0])
# 返回第二行
print(df.loc[1])
  • 注意:返回结果其实就是一个 Pandas Series 数据。
    也可以返回多行数据,使用 [[ … ]] 格式,… 为各行的索引,以逗号隔开:
# 返回第一行和第二行
print(df.loc[[0, 1]])   #返回结果其实就是一个 Pandas DataFrame 数据。
data=df.loc[2:5] 
#这里的[2:5]表示第3行到第5行内容,[]第一个起始是0,表示数据的第一行
  • 可以使用 loc 属性返回指定索引对应到某一行
df = pd.DataFrame(data, index = ["day1", "day2", "day3"])
# 指定索引
print(df.loc["day2"])
DataFrame.describe(percentiles=None
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值