数据分析作业六

最新推荐文章于 2023-02-27 23:01:43 发布

- 白鹿 -

最新推荐文章于 2023-02-27 23:01:43 发布

阅读量337

点赞数

分类专栏： python 习题笔记

本文链接：https://blog.csdn.net/weixin_55742843/article/details/119639628

版权

python 习题笔记专栏收录该内容

15 篇文章 1 订阅

订阅专栏

作业题目

拼接多个csv文件
去除重复数据，重新索引
自动挡和手动挡数目
计算每个城市二手车数量
统计每个汽车品牌平均售价价格(不是原价) (提示：groupby，可以先不做)

答案

拼接多个csv文件

代码

import numpy as np
import pandas as pd
csv_1 = pd.read_csv('../学习数据/guazi_bj.csv', encoding='utf-8', engine='python')  # 北京
csv_2 = pd.read_csv('../学习数据/guazi_gz.csv', encoding='utf-8', engine='python')  # 广州
csv_3 = pd.read_csv('../学习数据/guazi_sh.csv', encoding='utf-8', engine='python')  # 上海
csv_4 = pd.read_csv('../学习数据/guazi_sz.csv', encoding='utf-8', engine='python')  # 深圳
data = pd.concat([csv_1, csv_2, csv_3, csv_4])
data

执行效果

去除重复数据，重新索引

代码

data.drop_duplicates()
data.reset_index(drop=True)

执行效果

自动挡和手动挡数目

代码

a = data['speedbox'] == '自动'
print(a.sum())
b = data['speedbox'] == '手动'
b.sum()

执行效果

计算每个城市二手车数量

代码

# 北京 = 1539
c = csv_1.drop_duplicates()
c.info()
# -----------------------------------
# 广州 = 2007
d = csv_2.drop_duplicates()
d.info()
# ----------------------------------
# 上海 = 1937
e = csv_3.drop_duplicates()
e.info()
# ---------------------------------
# 深圳 = 1497
f = csv_4.drop_duplicates()
f.info()

执行效果

统计每个汽车品牌平均售价价格(不是原价) (提示：groupby，可以先不做)

代码

data_1 = data.groupby('brand')[['es_price']].mean()
data_1.head()

执行效果

- 白鹿 -

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
数据分析作业六

目录作业题目答案拼接多个csv文件代码执行效果去除重复数据，重新索引代码执行效果自动挡和手动挡数目代码执行效果计算每个城市二手车数量代码执行效果统计每个汽车品牌平均售价价格(不是原价) (提示：groupby，可以先不做)代码执行效果作业题目拼接多个csv文件去除重复数据，重新索引自动挡和手动挡数目计算每个城市二手车数量统计每个汽车品牌平均售价价格(不是原价) (提示：groupby，可以先不做)答案拼接多个csv文件代码import numpy as npim
复制链接

扫一扫