Datawhale Pandas研习社 第六次综合练习打卡

Datawhale Pandas研习社 第六次综合练习打卡

学习感受

Joyful Pandas教程非常详细,而且精准,不用担心有语句错误,所以之后会将它作为一份复习书或者工具字典来查。个人准备对照python数据科学上的相关内容,理清逻辑,再把这份教程好好刷一遍,多加练习,直至掌握。
感谢Datawhale的GYH同学精心编写这份教程并开源出来供大家学习,感谢社区能组织这样的活动把大家聚在一起学习。

第一题

data=pd.read_csv('2002年-2018年上海机动车拍照拍卖.csv') #数据读取

(1) 哪一次拍卖的中标率首次小于 5%?

data.rename(columns={'Total number of license issued':'issued',
                     'Total number of applicants':'applicants'},inplace=True)
data['rate']=data['issued']/data['applicants']
data['rate_1']=data['rate'].apply(lambda x:x<0.05)
data[rate_1==1].iloc[0]

(2) 按年统计拍卖最低价的下列统计量:最大值、均值、0.75 分位数,要求 显示在同一张表上。

data['year'] = data['Date'].apply(lambda x : 2000+int(x.split('-')[0]))
groupby = data_1.groupby(data['year'])['lowest price ']
a=groupby.max()
b=groupby.mean()
c=groupby.quantile(0.75)
table=pd.DataFrame({'max':a,'mean':b,'0.75quantile':c})

(3) 将第一列时间列拆分成两个列,一列为年份(格式为 20××),另一列为 月份(英语缩写),添加到列表作为第一第二列,并将原表第一列删除, 其他列依次向后顺延。

data['month'] = data['Date'].apply(lambda x : x.split('-')[1])
colnames = ['year','month']+list(data.columns[1:-4])
new= data.reindex(columns=colnames)

(4) 现在将表格行索引设为多级索引,外层为年份,内层为原表格第二至第 五列的变量名,列索引为月份。

(5) 一般而言某个月最低价与上月最低价的差额,会与该月均值与上月均值 的差额具有相同的正负号,哪些拍卖时间不具有这个特点?

(6) 将某一个月牌照发行量与其前两个月发行量均值的差额定义为发行增 益,最初的两个月用 0 填充,求发行增益极值出现的时间。

**

这两天好几门课要交结课论文,时间实在太紧,之后会抽空把题目好好思考补齐,谢谢助教!

**

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值