今天花了一天时间来研究DBLP,有一定的收获。
1.比较透彻地理解了XML格式的DBLP数据库。
对8中文献类型以及22种子元素进行了简单的分析和统计。
2.熟悉了RDF格式的DBLP数据库
目前对立面的一些类和属性还是不熟悉,熟悉也是下一步的重点。
在研究的过程中了解了D2R,后面应该会关注一下。
3.偶然了解了“分面导航”(也称分面搜索)技术
该技术目前已经在淘宝、亚马逊中广泛应用。需要解决的问题事,当属性以及属性至太多的情况下,如何给用户灵活地提供属性以及属性值,更进一步提高效率。
在这方面也有专家在专门研究,也有相关的开源项目支撑。如果有时间的话可以作进一步支撑。
一些心得:要专注,要有耐心。
下一步研究计划:面向DBLP XML格式数据库的研究。以网站提供的最短路径算法那篇文章以及相关源码作为突破口进行研究。同时读一读以DBLP作为数据源或者研究对象的英文文献。(中文文献很少)。
下周计划:面向DBLP RDF格式数据库的研究。