数据集,请参考:
链接:https://pan.baidu.com/s/1h-q4Nmb96rdKkYIuTEEe7Q
提取码:f8xn
一、2002 年-2018 年上海机动车拍照拍卖
问题
(1) 哪一次拍卖的中标率首次小于5%?
(2) 按年统计拍卖最低价的下列统计量:最大值、均值、0.75 分位数,要求
显示在同一张表上。
(3) 将第一列时间列拆分成两个列,一列为年份(格式为20××),另一列为
月份(英语缩写),添加到列表作为第一第二列,并将原表第一列删除,
其他列依次向后顺延。
(4) 现在将表格行索引设为多级索引,外层为年份,内层为原表格第二至第
五列的变量名,列索引为月份。
(5) 一般而言某个月最低价与上月最低价的差额,会与该月均值与上月均值
的差额具有相同的正负号,哪些拍卖时间不具有这个特点?
(6) 将某一个月牌照发行量与其前两个月发行量均值的差额定义为发行增
益,最初的两个月用0 填充,求发行增益极值出现的时间。
(1)哪一次拍卖的中标率首次小于5%?
import numpy as np
import pandas as pd
df = pd.read_csv('dataset/2002年-2018年上海机动车拍照拍卖.csv',index_col='Date')
df.head()
df = df.rename(columns=lambda x: x.replace(" ","_")) #去除列表column中的空格以下划线替代
#df = df.rename(columns=lambda x: x.replace("'","").replace('"','')).replace(" ","")
df.eval('BiddingRate = Total_number_of_license_issued/Total_number_of_applicants' , inplace=True)
# 计算中标率,并在df后新增一列
BiddingRate = df.loc[df['BiddingRate'] <