想要制作GIS,首先就需要获得我所需要的数据。没有数据,GIS就不配成为GIS,那就仅仅只是简单的、冰冷的地图而已,没有灵魂,没有生命,没有波动。
因此首要之急是寻找数据。
寻找数据
数据是死物,它们不会自己自觉地跑到我的手上的,这就需要我去寻找和搜集它们。现在是互联网时代,获取信息十分得便利。因此我想到搜集我所需要的数据方法可分为两种:
其一、在网上寻找其他人已经下载好的、整理好的并且打包好的数据,然后下载到自己电脑上保存。
其二、使用爬虫技术。任何语言都有爬虫技术,python由最为出色。因为目前有许多网站都在搜集有关新冠病毒疫情感染人数情况,比如丁香园、百度等等,而且这些网站的相关数据都是对大众免费开放,还为此提供了如何获取这些数据的说明,所以只要将爬取代码写好并运行,就可以轻轻松松地得到我所想要的数据等等,并且能将已经获得的数据存储到电脑里。
两种方法我都用excel保存起来,当然数据可以用csv、JSON等格式或者用mysql、nosql数据库来保存,但是excel相对来说操作简单且直观。
两种方法我都使用了。皇天不负有心人,第一种方法进行很成功,我获得了2019年12月1日到2020年4月30日的数据。接下来是讲述我用第二种方法爬取网页获取数据的事情。