一、前言
最近一直在学python数据科学的相关课程,主要看了《数据科学入门》这本动物书,但这本书是真的只入个门,把数据科学相关的各方面知识介绍了一下,真的只是介绍了一下,想要系统地学习还是得去看更细致的教程和官方文档。
不断地找网上的demo跟着敲,差不多的时候决定自己实现一个简单的案例。于是乎找到了一个很好的数据网站——国家数据。里面的数据支持多种形式的下载。
二、实现
这里是下载了中国近20年的总人口、男性人口、女性人口、城镇人口、乡村人口的数据。import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
# 指标
# 年末总人口(万人)
# 男性人口(万人)
# 女性人口(万人)
# 城镇人口(万人)
# 乡村人口(万人)
# 打开并读取csv文件
file = open("population_20.csv", 'r')
# 读取csv文件到DataFrame
# 这里若不添加参数encoding='gb18030' 会报错'utf-8' codec can't decode byte 0xc4 in position 4: invalid continuation byte
# 即utf-8无法被解析