作业一
1.拼接多个csv文件
2.去除重复数据,重新索引
3.自动挡和手动挡数目
4.计算每个城市二手车数量
5.统计每个汽车品牌平均售价价格(不是原价) (提示:groupby,可以先不做)
1.拼接多个csv文件
- 代码
import numpy as np
import pandas as pd
import os
guazi_list = os.listdir('./guazi')
print(guazi_list)
guazi_df_list = []
for file_name in guazi_list:
guazi_df = pd.read_csv(f'guazi/{file_name}')
guazi_df_list.append(guazi_df)
all_guazi_df = pd.concat(guazi_df_list)
print(all_guazi_df.info())
print(all_guazi_df)
- 运行结果
2.去除重复数据,重新索引
- 代码
all_guazi_df.drop_duplicates(inplace=True)
all_guazi_df.reset_index(inplace=True,drop=True)
print(all_guazi_df.info())
print(all_guazi_df)
3.自动挡和手动挡数目
- 代码
print(all_guazi_df['speedbox'].value_counts())
- 运行结果
4.计算每个城市二手车数量
- 代码
print(all_guazi_df['city'].value_counts())
- 运行结果
5.统计每个汽车品牌平均售价价格(不是原价)
- 代码
print(all_guazi_df.groupby(by='brand').mean()['es_price'])
- 运行结果