import pandas as pd
import numpy as np
一、2002 年-2018 年上海机动车拍照拍卖
df = pd.read_csv('./2002年-2018年上海机动车拍照拍卖.csv')
df.head()
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/323dfd8fcd073e6352805727685f0d72.png)
(1)哪一次拍卖的中标率首次小于5%?
df['rate'] = df['Total number of license issued'] / df['Total number of applicants']
df.query('rate<0.05')['Date'].iloc[0]
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/8f375246f21ff48084ee3f4e9bfc9f68.png)
(2) 按年统计拍卖最低价的下列统计量:最大值、均值、0.75 分位数,要求显示在同一张表上。
(3)将第一列时间列拆分成两个列,一列为年份(格式为 20××),另一列为月份(英语缩写),添加到列表作为第一第二列,并将原表第一列删除,其他列依次向后顺延。
(4)现在将表格行索引设为多级索引,外层为年份,内层为原表格第二至第五列的变量名,列索引为月份。
(5)一般而言某个月最低价与上月最低价的差额,会与该月均值与上月均值的差额具有相同的正负号,哪些拍卖时间不具有这个特点?
(6)将某一个月牌照发行量与其前两个月发行量均值的差额定义为发行增益,最初的两个月用 0 填充,求发行增益极值出现的时间。
二、、2007 年-2019 年俄罗斯机场货运航班运载量问题
df = pd.read_csv('./2007年-2019年俄罗斯货运航班运载量.csv')
df.head()
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/e0ba4d92b0b1f261d0efc9804d450beb.png)
(1)求每年货运航班总运量。
df.groupby('Year')['Whole year'].sum()
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/ae6dcaf9df2c63e29182201890a84855.png)
(2)每年记录的机场都是相同的吗?
(3) 按年计算 2010 年-2015 年全年货运量记录为 0 的机场航班比例。
(4)若某机场至少存在 5 年或以上满足所有月运量记录都为 0,则将其所有年份的记录信息从表中删除,并返回处理后的表格
(5)采用一种合理的方式将所有机场划分为东南西北四个分区,并给出 2017年-2019 年货运总量最大的区域。
(6) 在统计学中常常用秩代表排名,现在规定某个机场某年某个月的秩为该机场该月在当年所有月份中货运量的排名(例如 *** 机场 19 年 1 月运量在整个 19 年 12 个月中排名第一,则秩为 1),那么判断某月运量情况的相对大小的秩方法为将所有机场在该月的秩排名相加,并将这个量定义为每一个月的秩综合指数,请根据上述定义计算 2016 年 12 个月的秩综合指数。