python处理excel数据常用操作：更改列名称，将时间改为时间戳，时间取整，提取日时间戳，年月日转为DOY，删除列，提取所有列名称，筛选满足条件的行，路径/名称拆分，缺失值填充、数据替换

最新推荐文章于 2024-09-06 22:06:13 发布

PI理论

最新推荐文章于 2024-09-06 22:06:13 发布

阅读量630

点赞数 14

分类专栏： Python 文章标签： python 开发语言

本文链接：https://blog.csdn.net/weixin_46080995/article/details/135961349

版权

57 篇文章 2 订阅

订阅专栏

本文介绍了如何在Python中使用pandas对DataFrame进行操作，包括列名更改、时间格式转换、数据清洗（填充缺失值和替换特定值）、筛选有效数据行以及文件路径处理等关键步骤。

摘要由CSDN通过智能技术生成

# 更改列名称.rename()
df1.rename(columns={'Ta_10m': 'Ta'}, inplace=True)

df1["TIMESTAMP"] = pd.to_datetime(df1["TIMESTAMP"], errors='ignore')

# 这里是让一些不整点的时间整起来
freq = '1min'
df1["Date"] = df1['Date'].dt.round(freq)

df1['date'] = df1['Date'].dt.date

df1['DOY'] = df1['Date'].dt.dayofyear

df1.drop(labels = ["date"], axis = 1, inplace = True)  # 删除列，需要增加inplace = True这一项

header_list = df1.columns.to_list()

# 筛选出LE≠-6999且H≠-6999的行，保存为df1
df1 = df.loc[(data['LE'] != -6999) | (data['Hs'] != -6999)]

file = "D:\\YMJ_file\\1_last_plz\\fluxnet\\test.csv"
outpath = file.split(".csv")[0] + ".xlsx"

# "D:\\YMJ_file\\1_last_plz\\fluxnet\\test.xlsx"

# 将所有空值替换成-6999
data.fillna(-6999, inplace=True)
# 将所有-9999的值替换成-6999
data.replace(-9999, -6999, inplace=True)

关注

专栏目录