pandas

最新推荐文章于 2025-07-02 16:19:07 发布

LianYueBiao

最新推荐文章于 2025-07-02 16:19:07 发布

阅读量987

点赞数

CC 4.0 BY-SA版权

文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/alvinlyb/article/details/130038504

本文详细介绍了Pandas库，包括Series和DataFrame的操作，如数据清洗、插入、合并、删除、转换，以及保存读取文件。重点讲解了sort_values、sort_index、fillna、astype等常用函数的使用方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

- - Series
  - DataFrame
  - pandas属性
  - Json
  - 数据清洗
  - 常用函数
  - - sort_values
  - sort_index
  - fillna
  - astype
  - set_index
  - set_axis
  - describe

import pandas as pd

Series

pd.Series( data, index, dtype, name, copy)
data：一组数据(ndarray 类型)。
index：数据索引标签，如果不指定，默认从 0 开始。
dtype：数据类型，默认会自己判断。
name：设置名称。
copy：拷贝数据，默认为 False。

DataFrame

pd.DataFrame(data,index,columns,dtype,copy)
#data：一组数据(ndarray、series, map, lists, dict 等类型)。
#index：索引值，或者可以称为行标签。
#columns：列标签，默认为 RangeIndex (0, 1, 2, …, n) 。
#dtype：数据类型。
#copy：拷贝数据，默认为 False。

Pandas 可以使用 loc 属性返回指定行的数据，如果没有设置索引，第一行索引为 0，第二行索引为 1，以此类推：

data = {
   
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

# 数据载入到 DataFrame 对象
df = pd.DataFrame(data)

# 返回第一行
print(df.loc[0])
# 返回第二行
print(df.loc[1])

注意：返回结果其实就是一个 Pandas Series 数据。
也可以返回多行数据，使用 [[ … ]] 格式，… 为各行的索引，以逗号隔开：

# 返回第一行和第二行
print(df.loc[[0, 1]])   #返回结果其实就是一个 Pandas DataFrame 数据。
data=df.loc[2:5] 
#这里的[2:5]表示第3行到第5行内容，[]第一个起始是0，表示数据的第一行

可以使用 loc 属性返回指定索引对应到某一行

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])
# 指定索引
print(df.loc["day2"])

DataFrame.describe(percentiles=None

最低0.47元/天解锁文章