数据提取,用于从十几年前的中国旅游年鉴数据Excel表中提取指定内容数据,如旅游人数和旅游收入。这段代码假设你的Excel文件有一个名为"旅游人数"的列和一个名为"旅游收入"的列,并且你想要提取整个这两列的数据。以下是一个Python代码示例,
首先,确保你已经安装了pandas和openpyxl库。如果还没有安装,可以通过以下命令安装:
pip install pandas openpyxl
然后,你可以使用以下代码来提取数据:import pandas as pd # 指定Excel文件的路径
file_path = 'path_to_your_excel_file.xlsx' # 替换为你的Excel文件路径
# 读取Excel文件 df = pd.read_excel(file_path, engine='openpyxl')
# 检查数据的前几行以确认列名是否正确 print(df.head())
# 提取旅游人数和旅游收入列 tourism_data = df[['旅游人数', '旅游收入']]
# 显示提取的数据 print(tourism_data)
# 如果需要将提取的数据保存到新的Excel文件 output_file_path = 'extracted_tourism_data.xlsx'
# 输出的文件路径 tourism_data.to_excel(output_file_path, index=False)这段代码做了以下几件事:
导入pandas库。
指定Excel文件的路径。
使用read_excel函数读取Excel文件到一个名为df的DataF
Python pandas处理提取、缺失、重复、异常数据
最新推荐文章于 2024-05-21 22:44:12 发布