一、 2002 年-2018 年上海机动车拍照拍卖
import numpy as np
import pandas as pd
df = pd.read_csv('data/2002年-2018年上海机动车拍照拍卖.csv')
df.head()
问题
(1) 哪一次拍卖的中标率首次小于 5%?
one=df['Total number of license issued']/df['Total number of applicants']
df=df.assign(rate=one)
df[df['rate']<0.05].head()
Date | Total number of license issued | lowest price | avg price | Total number of applicants | rate |
---|---|---|---|---|---|
15-May | 7482 | 79000 | 79099 | 156007 | 0.047959 |
(2) 按年统计拍卖最低价的下列统计量:最大值、均值、 0.75 分位数,要求
显示在同一张表上。
(3) 将第一列时间列拆分成两个列,一列为年份(格式为 20××),另一列为
月份(英语缩写),添加到列表作为第一第二列,并将原表第一列删除,
其他列依次向后顺延。
(4) 现在将表格行索引设为多级索引,外层为年份,内层为原表格第二至第
五列的变量名,列索引为月份。
(5) 一般而言某个月最低价与上月最低价的差额,会与该月均值与上月均值
的差额具有相同的正负号,哪些拍卖时间不具有这个特点?
(6) 将某一个月牌照发行量与其前两个月发行量均值的差额定义为发行增
益,最初的两个月用 0 填充,求发行增益极值出现的时间。