数据分析之pandas-综合练习1
一、2002 年-2018 年上海机动车拍照拍卖
import pandas as pd
import numpy as np
df = pd.read_csv('./data/2002年-2018年上海机动车拍照拍卖.csv')
df.head()
df.info()
问题
(1) 哪一次拍卖的中标率首次小于 5%?
考察点:创建列、索引
df1 = df.assign(zbl=df['Total number of license issued']/df['Total number of applicants'])
df1[df1['zbl'] < 0.05].head(1)
(2) 按年统计拍卖最低价的下列统计量:最大值、均值、0.75 分位数,要求
显示在同一张表上。
考察点:创建列、索引、分组、统计量、分列
df2 = df3.groupby('Year')
df2.head()
newdf = pd.DataFrame()
newdf['max'] = df2['lowest price '].max(