python-数据统计

import sys

import pandas as pd

import numpy as np

import matplotlib

import matplotlib.pyplot as plt

import random as rd

 

print('Python: {}'.format(sys.version))

print('pandas: {}'.format(pd.__version__))

print('numpy: {}'.format(np.__version__))

print('matplotlib {}'.format(matplotlib.__version__))

 

df = pd.read_csv('Sacramentorealestatetransactions.csv')

 

print(df.head(10))

 

print(df.describe())

 

df_NumData = df[['beds','baths','sq__ft','price']]

print(df_NumData.describe())

 

df['price'].hist(bins=100)

plt.show()

 

df.boxplot(column='price')

plt.show()

 

df.boxplot(column='price', by = 'beds')

plt.show()

 

df[['price','beds']].groupby('beds').boxplot()

plt.show()

 

bedcount = df['beds'].value_counts()

print(bedcount)

 

bedcount = df['beds'].value_counts(ascending=True)

print(bedcount)

 

print(bedcount.sort_index(axis=0,ascending=True))

 

print(bedcount.sort_index(axis=0,ascending=False))

 

print(bedcount.sort_values(axis=0))

 

avgPricePivot = df.pivot_table(values='price',index=['beds'],aggfunc=lambda x: x.mean())

print(avgPricePivot)

 

avgPricePivot = df.pivot_table(values='price',index=['beds'],aggfunc=lambda x: [x.mean(),x.min(), x.max()])

print(avgPricePivot)

 

pd.plotting.scatter_matrix(df_NumData)

plt.show()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值