探索 FindSampo:考古发现的语义化平台
1. 引言
在考古领域,如何有效组织和分析公众发现的考古数据是一个重要挑战。FindSampo 作为一个公民科学平台,旨在解决这一问题,它提供了一套强大的工具来探索和分析考古发现。
2. 数据映射与转换
为了便于将芬兰的考古发现数据与国际数据进行比较,我们创建了芬兰 MAO 术语与国际本体(尤其是盖蒂艺术与建筑词库 AAT)的映射。通过 AAT,还可以进一步链接到其他国际词汇表。例如,利用 Ariadne 项目创建的 AAT 与 FISH 考古对象词库之间的映射,实现了芬兰本体与 FISH 本体的关联。
数据转换是 FindSampo 的关键步骤。源数据以 CSV 格式接收,并转换为 RDF 格式。转换管道主要包括数据转换和本体转换两部分,均使用基于 RDFLib 库的 Python 脚本。具体步骤如下:
1. 本体创建 :将 CSV 中定义的本体转换为 RDF 格式。
2. 初始处理 :创建仅包含文字值的简单 RDF 文件。
3. 丰富处理 :清理数据,并根据本体定义为数据创建本体化的值。
4. 三元组存储 :使用更新后的数据自动构建三元组存储。
graph LR
A[Data CSV from FHA] --> B[Data conversion]
C[Ontology CSV] --> D[Ontolog