import pandas as pd #读取保存的预得理好的数据 df = pd.read_excel('./酒店数据1.xlsx') df = df.drop('Unnamed: 0',axis=1) #查看“评分”的格式 print(df['评分'].dtype) #df['评分'] = df['评分'].astype(np.int64) #分别对评分进行升序和降序排序 df_sores_up = df.sort_values(by='评分',ascending=False) print(df_sores_up) df_sores_down = df.sort_values(by='评分',ascending=False)[::-1] print(df_sores_down) #对酒店按照价格进行排名 df_price_up = df.sort_values(by='价格',ascending=False) print(df_price_up) #计算“油尖旺”地区的均价 print('计算“油尖旺”地区的均价') print(df['价格'].groupby(df['地区']).mean()['油尖旺']) #print(df[df['地区'] == '油尖旺']['价格'].mean()) #对酒店数据进行描述性统计 print(df.describe()) #所有价格的均值方差,最大最小值,中值 print('所有价格的均值方差') print(df['价格'].std())#均值方差 print('所有价格的最大值') print(df['价格'].max())#最大值 print('所有价格的最小值') print(df['价格'].min())#
酒店数据分析pandas
最新推荐文章于 2024-06-29 09:00:00 发布