数据分析作业六

作业题目

  • 拼接多个csv文件
  • 去除重复数据,重新索引
  • 自动挡和手动挡数目
  • 计算每个城市二手车数量
  • 统计每个汽车品牌平均售价价格(不是原价) (提示:groupby,可以先不做)

答案

拼接多个csv文件

代码

import numpy as np
import pandas as pd
csv_1 = pd.read_csv('../学习数据/guazi_bj.csv', encoding='utf-8', engine='python')  # 北京
csv_2 = pd.read_csv('../学习数据/guazi_gz.csv', encoding='utf-8', engine='python')  # 广州
csv_3 = pd.read_csv('../学习数据/guazi_sh.csv', encoding='utf-8', engine='python')  # 上海
csv_4 = pd.read_csv('../学习数据/guazi_sz.csv', encoding='utf-8', engine='python')  # 深圳
data = pd.concat([csv_1, csv_2, csv_3, csv_4])
data

执行效果

1

去除重复数据,重新索引

代码

data.drop_duplicates()
data.reset_index(drop=True)

执行效果

2

自动挡和手动挡数目

代码

a = data['speedbox'] == '自动'
print(a.sum())
b = data['speedbox'] == '手动'
b.sum()

执行效果

3

计算每个城市二手车数量

代码

# 北京 = 1539
c = csv_1.drop_duplicates()
c.info()
# -----------------------------------
# 广州 = 2007
d = csv_2.drop_duplicates()
d.info()
# ----------------------------------
# 上海 = 1937
e = csv_3.drop_duplicates()
e.info()
# ---------------------------------
# 深圳 = 1497
f = csv_4.drop_duplicates()
f.info()

执行效果

4

统计每个汽车品牌平均售价价格(不是原价) (提示:groupby,可以先不做)

代码

data_1 = data.groupby('brand')[['es_price']].mean()
data_1.head()

执行效果

5

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值