1.单项选择题
2.编程题
租房数据预处理(4)
描述
1.请读取租房数据原始文件zfsj_group.csv,某5行数据如下图所示。
2.请对"户型"列数据统计,筛选出数量大于50的户型,按数量降序,输出户型数量排名的结果如下。
3.统计数据结果为zfsj4_after.csv文件。请参考编程模板完善代码。本题目支持文件在线评阅。
输入输出示例
输入 | 输出 | |
示例 1 | [输出处理好结果到zfsj4_after.csv] |
import numpy as np
import pandas as pd
file_path = open("zfsj_group.csv", encoding="utf-8")
file_data = pd.read_csv(file_path)
house_array = file_data["户型"]
df = pd.DataFrame(house_array)
df['num'] = 1
df = pd.DataFrame((df.groupby('户型')['num'].agg(np.sum)))
df.sort_values('num', ascending=False, inplace=True)
df.reset_index(inplace=True)
df.columns = ['户型', '数量']
df[df['数量'] > 50].to_csv("zfsj4_after.csv", encoding="utf-8", header=True)