项目实训-数据源讨论

项目实训-数据源讨论

最后将要进行页面展示的内容:

  • 全球方面疫情确诊情况(精确到天,以国家为划分)——可以考虑以柱状图或热力图的方式来进行展示,人力观察全球疫情各地区数据来确定不同颜色(或柱状图刻度)划分区间
  • 国内疫情确诊情况(精确到天,以省份作为划分)——与以上采取相同展示形式
  • 全球各国病死率和治愈率分析(精确到周)——根据汇总进行前十位排序,柱状图中以不同颜色分别代表病死率和治愈率
  • 前十位国家累计死亡人数(精确到天)——既要展示数据量又要展示死亡数在全球死亡数中所占比例,所以采用玫瑰图形式,半径长短区分数值大小,角度大小表示占比
  • 前五位国家某月累计确诊人数按天展示——可采用动态图形式,或者各国分别折线图形式展示趋势

支付宝疫情数据:
在提出的几个数据源中最完整最全面,在划分上最细致,地区上可以到定位点所在小区疫情方面信息。但是安全防护措施很高,除去登录之外还有换IP的手机验证码验证流程等保护用户信息的措施,且本身支付宝原则上不允许爬虫爬取应用内数据。另外,它的疫情数据显示是根据所使用设备的定位来实时刷新数据显示的,爬取时从页面抓取数据,需要一次性获取全球范围的所有地域细分数据较为困难。所以将这条先否决。

经过一系列讨论之后我们最后开会得出的结果:
初步结果:
我们目前认为可以综合使用网易和丁香园的数据,丁香园部分数据在展示统计类型可视化时更方便,而网易的更细致。我们在接下来的几天里会把这两个网站的数据源分别先爬取少量下来,用这少量数据先做出几张可视化html文件给前端页面编写的同学,方便她们先用这个开始前端页面的编写工作。后台数据爬取和可视化的同学会同时对这两个网页进行大量数据的爬取,并尝试按照我们提出的需求进行可视化操作,看看这两种哪种更合适,或者是两种类型综合一起使用。

除此而外,作为负责可视化部分的同学,由于数据还未完全爬取下来,我先看一下pyecharts的可视化库,争取做的时候能够尽快完成编码任务。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值