用 Python 分析各国人口性别比例

640?wx_fmt=jpeg

文/萝卜大杂烩 图片来源于网络

缘起

不知道从什么时候开始,广大程序猿们(不包括程序媛们)总是被调侃,一直都是那个靠实力单身的群体。

而根据网上不知道是否准确的数据显示,中国的单身人口高达2亿,我的天,不能这两亿都是程序猿吧

640?wx_fmt=jpeg

今天不是来探究这个单身数字的,而是选择了一个切入点,来探究下,码农单身到底是哪里的锅。

切入点

而我选择的切入点就是人口结构数据,通过观察人口结构,男女比例,来看看单不单身,是不是由你说了算。

首先感谢下“快易理财网”的数据

https://www.kuaiyilicai.com

我这里使用的数据,都是来自于该网站,网站上还有各类财经数据,有兴趣的小伙伴儿们可以去看看。

640

获取我国女性占比

640

首先我们先来抓取下我国女性的逐年占比数据,看看找对象在什么时代能容易些

640?wx_fmt=jpeg

抓取该网站还是很容易的,直接解析 HTML 文件即可

import requests
from bs4 import BeautifulSoup


url = 'https://www.kuaiyilicai.com/stats/global/yearly_per_country/g_population_female_perc/chn.html'
res = requests.get(url).text
html = BeautifulSoup(res, 'html.parser')
html.find('tbody').find_all('td')

这样,就获取到了所有的表格数据

[<td>2018年</td>,
 <td>48.68%</td>,
 <td>2017年</td>,
 <td>48.67%</td>,
 <td>2016年</td>,
 <td>48.65%</td>,
 <td>2015年</td>,
 <td>48.64%</td>,
 <td>2014年</td>,
 <td>48.63%</td>,
...

不过这个表格数据里会有谷歌广告的代码,需要去掉下

chinese_data = html.find('tbody').find_all('td')
i = 0
for d in chinese_data:
    if r"adsbygoogle" in d.text:
        chinese_data.pop(i)
    i += 1

接下来就可以获取年份和对应的数据了

 
 

拿到 year 和 data 两个列表后,我们就可以开始作图了。

当然我还获取了世界上其他国家的女性比例,出生性别比例等数据,抓取方式都类似,就不再一一重复了。

作图分析

640

历年女性占比分析

640

640?wx_fmt=gif 

可以看到,我国的女性占比常年是低于50%,大胆推测,这绝对和我们上下五千年的历史文化遗留有关啊,嗯,就说到这,不能再多说了。

然后还能看出,在新中国建国初期,女性的比例是最低的,之后才逐年增加。按道理来讲,在经历了军阀混战,抗日战争等数十年战乱后,数以百万的热血男儿血洒中华大地的背景下,男女比例应该有所平衡啊,没想到竟然还是男女比例失衡的这么严重。

不过情形在慢慢变好,在上世纪80年代左右,我国的女性占比很好的稳定在了48.69%-48.68%这里,而48.69%竟然已经是女性占比的最高比例了。

接着又不太清楚是什么情况,在新千年的前十年里,女性比例又大幅下降,随后才又逐年增长,不知道正在上小学或者初中的小男孩们,有没有感觉到身边的异性有点少啊。

我这里还做了柱状图,同样可以看到在60年到70年这十年里,女性比例的增长还是非常明显的

640?wx_fmt=png
接下来我们着重看看2018年的数据吧,这一年女性占比为48.68%,而根据人口普查,2018年我国总人口为13.93亿 (1,392,730,000),那么男性比女性就多出了36,768,072,整整3千6百多万人啊。所以说如果你在去年还是单身,那么不要悲伤,因为最少还有3千多万人陪着你,当然如果你现在成功脱单了,祝贺你,你是那个踏过独木桥的人,堪称中了超级福利彩票,请一定要珍惜

640

历年出生比例分析

640

出生人口性别比是指活产男婴数与活产女婴数的比值。正常情况下,出生性别比是由生物学规律决定的,保持在1.02—1.07之间。

也就是说正常情况下统计学界和生物学界已经默认了男性出生比例要高于女性呀。

640?wx_fmt=jpeg

下面就来看看我国历年的出生性别走势图

640?wx_fmt=gif
可以看到,在1990年以前,我们出生性别比例还都能保持在正常水平,但是在临近新千年和新千年的头十年里,这一比例大幅增长,难道说在这一期间“养儿防老”这一口号正在盛行?

具体原因就不再深究了,咱也不知道,咱也不敢说啊。

我们还是找一年为例子,看看该年出生的男女数量的差值

我以2007年为例子,这一年的出生性别比例为1.17,虽然我们拿不到当年的总的出生人数,但是可以拿到当年的出生率和人口总数啊,那么也是可以勉强计算下的。

在我的一番小学数学操作下,得出2007年出生男孩比女孩多了1,672,560人,一百多万啊,这还只是一年,那么多年累计下来,差个3千多万也就正常了。
640?wx_fmt=jpeg
所以说,在2007年出生的男同胞们,虽然还!没!到!找!对!象!的年纪,但是要趁早啊,你们压力山大,形势险峻啊!大学时能下手,不要等到毕业;高中时有机会,不要留到异地;初中时有想法,别想着上高中的;小学时春心荡漾了,你就等着挨揍吧(男女混合双打,就问你怕不怕)!

640?wx_fmt=jpeg

上面说了这么多国内的苦大仇深,接下来看看世界范围内的数据吧,是幸福还是痛苦,比对才能出真理啊

640

世界各国(或地区)女性占比

640

我这里先选取了世界范围内女性占比前十的数据,来看看哪个国家(或地区)的男同胞们最幸福

640?wx_fmt=png 

我们一直听到的都是东欧美女多,剩女也多,看来真的不假啊。拉脱维亚、立陶宛、乌克兰,白俄罗斯这些国家是不是大家都耳熟能详,在多少个慢慢长夜,孤枕难眠的时候,哎呀我去,跑题了!

不过前些年网络上流行的国内屌丝小伙,到了乌克兰通过个人奋斗,成功迎娶白富美,走上人生巅峰的事迹还是一直在激励着我(们)呀。

640?wx_fmt=png

这么多年过去了,他还好吗?

再来看下榜单的第一位,库拉索,这是个神马地方,表示没听过。百度之

640?wx_fmt=png 

原来是荷兰王国的自治领地啊,人口常年在15万人左右,感觉没啥好说的。

640?wx_fmt=jpeg

下面就刺激了,我们来看看女性比例排名后十的国家和地区都是哪些呢

640?wx_fmt=png 

从后面数五个,清一色的穆斯林国家,而卡塔尔和阿联酋的女性比例竟然还不到30%。

640?wx_fmt=jpeg
爱生活,爱自己

640

世界范围出生性别比例

640

最后我们再来看下在世界范围内,出生性别比例的数据

比例最高的前十名

640?wx_fmt=png 

没想到我国竟然荣登榜首,看来两千多年的封建史,带来的某些根深蒂固的思维,不是一时之间就可以完全冲破的。时至今日,还有相当一部分的人保留着陈旧的思想--重男而轻女。但是啊,时代不同了,男女都一样喽!

640?wx_fmt=png
女子能顶半边天

所以说,综上分析,作为程序猿们,我们成功脱单,那是个人实力和人格魅力的成功体现,如果还在单身,没事儿的朋友,大环境不好啊

640?wx_fmt=png
别说了

好了,今天的分享就到这里了,怎么样,找到你单身的原因了嘛,你赶上那个最好最坏的时代了吗?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值