租房数据预处理(3)
描述
1.请读取租房数据原始文件zfsj_group.csv,某5行数据如下图所示。
2.请对"区域"列数据统计,统计结果如下。
3.统计数据结果为zfsj3_after.csv文件,文件内前五行数据如下所示。**请参考编程模板完善代码。本题目支持文件在线评阅。**
输入输出示例
输入 | 输出 | |
---|---|---|
示例 1 | [输出处理好结果到zfsj3_after.csv] |
代码:
import numpy as np
import pandas as pd
file_path = open("zfsj_group.csv", encoding="utf-8")
file_data = pd.read_csv(file_path)
housetype_data = file_data["户型"]
file_data.drop_duplicates(inplace=True)
file_data.dropna(inplace=True)
df = pd.DataFrame(file_data.groupby('区域').count())
df.drop(['户型', '面积(㎡)', '价格(元/月)'], axis=1, inplace=True)
df.rename(columns={'小区名称': '小区数量'}, inplace=True)
df = df.reset_index()
df.to_csv("zfsj3_after.csv", encoding="utf-8", header=True)