案例:2018年北京积分落户分析

本文分析2018年北京积分落户情况,华为公司在落户人数中占据显著位置,IT企业和国企较为集中。积分主要集中在90~100分,48岁以下人员占比99.5%,42~45岁为最高峰。高分段人数少,主要因高学历、创新创业和荣誉表彰人员不足。成功落户关键在于年龄、创新创业和荣誉表彰积分。
摘要由CSDN通过智能技术生成

一、北京积分落户政策概述

北京积分落户制是北京市政协建议推行的积分落户政策,以科技贡献、专业技能、在京时间等指标为考核项,计算非京籍人才的“积分”,积分达标即可落户北京。北京市积分落户自2017年1月1日起施行,每年申请一次。

二、北京积分落户的部分积分指标

北京积分落户一共有9项积分指标,下面罗列了其中的4项,这4项也是积分分值较多、较容易拉开差距且获得高分的指标。
在这里插入图片描述
为了能更直观地反映2018年北京积分落户的情况,下面将对2018年落户成功的人员名单就行分析。

三、导入要使用的模块

import pandas as pd
from matplotlib import pyplot as plt
from matplotlib import rcParams

四、读取数据

luohu_data = pd.read_csv("./beijing_luohu.csv", index_col = "id")
luohu_data.index.name = None
rcParams["font.sans-serif"] = ["KaiTi"]
rcParams['axes.unicode_minus'] = False

查看分值的基本情况:

print("最低分:",luohu_data["score"].min())
print("最高分:",luohu_data["score"].max())
print("平均分:",round(luohu_data["score"].mean(),2))

输出:
最低分: 90.75
最高分: 122.59
平均分: 95.65

五、清洗数据

由于北京积分落户名单是官方发布的,数据较规范,不过为了确保无误,我们可以执行以下代码:

print(luohu_data.info())

输出:
<class ‘pandas.core.frame.DataFrame’>
Int64Index: 6019 entries, 1 to 6019
Data columns (total 4 columns):
name 6019 non-null object
birthday 6019 non-null object
company 6019 non-null object
score 6019 non-null float64
dtypes: float64(1), object(3)
memory usage: 235.1+ KB

显然,这份名单有6019条数据,且各个字段都没有缺失值,因此我们可以直接分析。

六、分析及可视化

1. 落户成功人数最多的前20名公司
# 对公司进行分组
company_gb = luohu_data.groupby(by = "company", as_index = False).count()[["company", "name"
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值