案例：2018年北京积分落户分析

最新推荐文章于 2024-08-07 17:53:13 发布

lin_yz

最新推荐文章于 2024-08-07 17:53:13 发布

阅读量913

点赞数

文章标签：数据分析

本文链接：https://blog.csdn.net/weixin_44376516/article/details/103425849

版权

本文分析2018年北京积分落户情况，华为公司在落户人数中占据显著位置，IT企业和国企较为集中。积分主要集中在90～100分，48岁以下人员占比99.5%，42～45岁为最高峰。高分段人数少，主要因高学历、创新创业和荣誉表彰人员不足。成功落户关键在于年龄、创新创业和荣誉表彰积分。

摘要由CSDN通过智能技术生成

一、北京积分落户政策概述

北京积分落户制是北京市政协建议推行的积分落户政策，以科技贡献、专业技能、在京时间等指标为考核项，计算非京籍人才的“积分”，积分达标即可落户北京。北京市积分落户自2017年1月1日起施行，每年申请一次。

二、北京积分落户的部分积分指标

北京积分落户一共有9项积分指标，下面罗列了其中的4项，这4项也是积分分值较多、较容易拉开差距且获得高分的指标。
在这里插入图片描述
为了能更直观地反映2018年北京积分落户的情况，下面将对2018年落户成功的人员名单就行分析。

三、导入要使用的模块

import pandas as pd
from matplotlib import pyplot as plt
from matplotlib import rcParams

四、读取数据

luohu_data = pd.read_csv("./beijing_luohu.csv", index_col = "id")
luohu_data.index.name = None
rcParams["font.sans-serif"] = ["KaiTi"]
rcParams['axes.unicode_minus'] = False

查看分值的基本情况：

print("最低分：",luohu_data["score"].min())
print("最高分：",luohu_data["score"].max())
print("平均分：",round(luohu_data["score"].mean(),2))

输出：
最低分： 90.75
最高分： 122.59
平均分： 95.65

五、清洗数据

由于北京积分落户名单是官方发布的，数据较规范，不过为了确保无误，我们可以执行以下代码：

print(luohu_data.info())

输出：
<class ‘pandas.core.frame.DataFrame’>
Int64Index: 6019 entries, 1 to 6019
Data columns (total 4 columns):
name 6019 non-null object
birthday 6019 non-null object
company 6019 non-null object
score 6019 non-null float64
dtypes: float64(1), object(3)
memory usage: 235.1+ KB

显然，这份名单有6019条数据，且各个字段都没有缺失值，因此我们可以直接分析。

六、分析及可视化

1. 落户成功人数最多的前20名公司

# 对公司进行分组
company_gb = luohu_data.groupby(by = "company", as_index = False).count()[["company", "name"

最低0.47元/天解锁文章

lin_yz

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫