2015年, 48.64%, 2014年, 48.63%,
…
不过这个表格数据里会有谷歌广告的代码,需要去掉下
chinese_data = html.find(‘tbody’).find_all(‘td’)
i = 0
for d in chinese_data:
if r"adsbygoogle" in d.text:
chinese_data.pop(i)
i += 1
接下来就可以获取年份和对应的数据了
year = []
data = []
i = 1
for d in chinese_data:
if i == 1 or i%2 != 0:
year.append(d.text)
else:
temp = d.text.split(‘%’)
data.append(temp[0])
i += 1
拿到 year 和 data 两个列表后,我们就可以开始作图了。
当然我还获取了世界上其他国家的女性比例,出生性别比例等数据,抓取方式都类似,就不再一一重复了。
</