Python数据分析实战-Boston Public Schools GEO数据分析-Part1

项目目标:

Boston Public Schools Geo数据是来自于Boston地区的公共学校的数据,具体描述了学校的坐标,名字,类型等。基于此数据,我们可以学习一些基本的Python数据分析的方法。例如,研究学校的分布情况,类型统计等。

数据集介绍:

数据集的介绍如下,其中比较重要的字段有X,Y坐标,ADDRESS地址,ZIPCODE,School类型

Data columns (total 21 columns):
X 131 non-null float64
Y 131 non-null float64
OBJECTID_1 131 non-null int64
OBJECTID 131 non-null int64
BLDG_ID 131 non-null int64
BLDG_NAME 131 non-null object
ADDRESS 131 non-null object
CITY 131 non-null object
ZIPCODE 131 non-null int64
CSP_SCH_ID 131 non-null int64
SCH_ID 131 non-null int64
SCH_NAME 131 non-null object
SCH_LABEL 131 non-null object
SCH_TYPE 131 non-null object
SHARED 131 non-null object
COMPLEX 131 non-null object
Label 131 non-null int64
TLT 131 non-null int64
PL 131 non-null object
POINT_X 131 non-null float64
POINT_Y 131 non-null float64

关键代码实现:

  1. 加载数据

    schools = pd.read_csv('../input/Public_Schools.csv')
    schools.info()


    可以看到数据字段如下,一共有21个字段,其中有9个Object类型,4个float64, 8个int64
     

    复制代码

    <class 'pandas.core.frame.DataFrame'>
    RangeIndex: 131 entries, 0 to 130
    Data columns (total 21 columns):
    X 131 non-null float64
    Y 131 non-null float64
    OBJECTID_1 131 non-null int64
    OBJECTID 131 non-null int64
    BLDG_ID 131 non-null int64
    BLDG_NAME 131 non-null object
    ADDRESS 131 non-null object
    CITY 131 non-null object
    ZIPCODE 131 non-null int64
    CSP_SCH_ID 131 non-null int64
    SCH_ID 131 non-null int64
    SCH_NAME 131 non-null object
    SCH_LABEL 131 non-null object
    SCH_TYPE 131 non-null object
    SHARED 131 non-null object
    COMPLEX 131 non-null object
    Label 131 non-null int64
    TLT 131 non-null int64
    PL 131 non-null object
    POINT_X 131 non-null float64
    POINT_Y 131 non-null float64
    dtypes: float64(4), int64(8), object(9)
    memory usage: 21.6+ KB

    复制代码


    2.接下来,探索数据的缺失值

    schools.isnull().any() 

    可以看到,数据没有缺失值

    复制代码

     1 X False
     2 Y False
     3 OBJECTID_1 False
     4 OBJECTID False
     5 BLDG_ID False
     6 BLDG_NAME False
     7 ADDRESS False
     8 CITY False
     9 ZIPCODE False
    10 CSP_SCH_ID False
    11 SCH_ID False
    12 SCH_NAME False
    13 SCH_LABEL False
    14 SCH_TYPE False
    15 SHARED False
    16 COMPLEX False
    17 Label False
    18 TLT False
    19 PL False
    20 POINT_X False
    21 POINT_Y False
    22 dtype: bool

    复制代码

     

  2. 接下来,Count frequency of schools in each city
     

    1 schools_per_city = schools['CITY'].value_counts()
    2 sns.set()
    3 plt.rcParams['figure.figsize'] = [20, 7]
    4 sns.barplot(x=schools_per_city.index, y=schools_per_city.get_values())


    __results___7_1

可以看到不同地区的公立学校不同数量

  1. 按照ZIPCode统计学校情况
    1 school_zipcode = schools['ZIPCODE'].value_counts() sns.set() 
    2 sns.barplot(x=school_zipcode.index, y=school_zipcode.get_values())

     

    __results___8_1

未完待续~  欢迎大家关注我的公众号,“思享会Club”,获取该内容资源。欢迎大家访问http://gkhelp.cn 获取更多项目

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

老钱的人工智能探索

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值