探索数据的力量: cholera——重构约翰·斯诺的霍乱地图
去发现同类优质开源项目:https://gitcode.com/
1、项目介绍
cholera
是一个基于R语言的开源项目,旨在修正和增强对约翰·斯诺1854年伦敦霍乱地图的分析。这个包不仅修复了Dodson和Tobler在1992年数字化过程中的一些错误,还提供了一系列工具,使得数据可视化和分析更为便捷、精确。它将斯诺的地图数据重新整理,以便于更深入的研究和理解城市疾病传播模式。
2、项目技术分析
cholera
包含的功能亮点有:
- 错误修正:修复了三个病例位置错误和一条道路缺失的问题。
- 数据解构:通过两种方式“展开”数据,使分析与可视化更加简单且有意义。
- 计算和可视化泵区域:基于欧几里得距离(Voronoi细分)和步行距离来定义“泵区域”。
- 图形元素叠加:通过
add*()
函数,可以添加如核密度估计、Voronoi图、斯诺的Broad Street邻里和其他地标。 - 各种查找和高亮功能:针对案件、道路、水泵和路径进行操作。
- 街道名称附加:为
roads
数据集添加街道名称。 - 修订后的泵数据:包含第二版地图中使用的更新后的泵数据,并包括“正确”的Broad Street泵位置。
- 时间序列数据:提供两个聚合死亡率数据集,源自Vestry报告。
- 并行计算支持:适用于Linux、macOS和Windows系统。
3、项目及技术应用场景
cholera
的应用场景广泛,尤其适合历史地理数据分析、流行病学研究、公共卫生政策制定以及数据可视化的教学。它帮助研究人员复盘斯诺的经典案例,理解如何通过地图推断疾病的传播途径,同时也适用于现代城市规划和公共健康研究。
4、项目特点
- 数据准确度:修复已知的历史错误,提高数据质量。
- 易用性:“unstacking”数据结构简化分析步骤。
- 实用性:提供多种实用工具,如计算行走距离,创建泵区域等。
- 可扩展性:支持并行计算,提高处理大量数据的效率。
- 地理定位:从版本0.8.0开始,提供经度和纬度的地理参照数据和功能。
想要安装cholera
包,只需简单执行以下代码:
# 从CRAN安装
install.packages("cholera")
# 或者从GitHub获取最新开发版本
remotes::install_github("lindbrook/cholera", build_vignettes = TRUE)
借助cholera
,你可以亲自探索那个时代的数据,重现和验证斯诺的伟大发现,甚至在新的角度上挑战和深化我们对霍乱传播的理解。这不仅是一次回到过去的技术旅行,更是一场科学思维的洗礼。现在就加入我们,一起揭示隐藏在地图深处的故事吧!
去发现同类优质开源项目:https://gitcode.com/