引 言
当前,传统的图书馆借阅服务模式正在向以读者为中心的智慧型知识服务模式转变,这正成为图书馆服务模式未来发展的必然趋势。 随着信息技术水平的发展和用户个性化阅读服务需求的提升,图书馆在其服务建设上必须突出“智慧性”以满足读者的阅读体验和满意度。在当前泛在信息环境下,知识弥漫对图书馆的知识服务能力和水平提出了更高的要求,用户关注的重点已从简单发现信息转变为以最高效的方式获取满足自身个性化需求的知识资源。图书馆个性化推荐则是指以读者的个人背景、专业、习惯、爱好和提出的特别要求等为依据,对每一个读者提供个性化的推荐服务。为此,我们根据已有的可靠数据,以SPSS为辅助工具,分析学生们在大学期间利用图书馆的习惯变迁,其中包括对学院,专业,外借书籍类别等特征的分析并提出相应的书籍推荐服务。
一、挖掘目标
本文的目标是通过挖掘图书馆2020年~2024年统计的进馆与外借记录数据,分析包括外借书籍的类别,进馆与外借的频度与关联,学院、专业或班级的差异等特征,刻画描述该年级同学在大学四年间利用图书馆的习惯及其伴随时间的迁移,并进行可视化的展示。
二、数据来源
本次数据源自官方提供的某个年级学生的图书馆进馆和外借记录。其中进馆记录包含两个字段,学号和进馆时间,比如160109 20200906105603记录表示学号为160109的学生在2020年09月06日10时56分03秒刷卡进馆,共计233384条记录。外借记录包含三个字段,分别是学号,外借时间和索书号,比如160104 20240605191803 O342/6-2 记录表示学号为160104的学生在2024年06月05日19时18分03秒外借了索书号为O342/6-2的图书。共计23963条记录。进一步,学号由学院,专业班级编号和班内顺序号组成,比如160109表示学院编号为16,专业编号为0,同专业班级序号为1,该生在班内的编号为09。索书号依据《中国图书馆图书分类法》取号,比如O342/6-2表示固体力学类的图书。我们将运用SPSS,对变量进行频数统计、相关分析等手段,旨在了解该年级同学们在大学四年间利用图书馆的习惯及其伴随时间的迁移。
三、数据处理
在数据分析之前我们首先对进馆记录和外借记录进行质量检验,其中进馆时间存在重复记录,我们对其进行去重操作。
进馆时间原始数据:
去重后有效数据:
四、数据分析
1、各学院2020年~2024年借书统计量分析:
学院 |
|||||
|
频率 |
百分比 |
有效百分比 |
累积百分比 |
|
有效 |
16 |
5625 |
23.5 |
23.5 |
23.5 |
23 |
6044 |
25.2 |
25.2 |
48.7 |
|
24 |
6747 |
28.2 |
28.2 |
76.9 |
|
26 |
5057 |
21.1 |
21.1 |
98.0 |
|
28 |
490 |
2.0 |
2.0 |
100.0 |
|
合计 |
23963 |
100.0 |
100.0 |
|
由直方图可直观看出,学院24的借书量最大,为6747本,而学院28的借书量最少只有490本。其他三个学院差距较小。
2、该年级同学在2020年~2024年借书变化:
年份 |
|||||
|
频率 |
百分比 |
有效百分比 |
累积百分比 |
|
有效 |
2020 |
2345 |
9.8 |
9.8 |
9.8 |
2021 |
6998 |
29.2 |
29.2 |
39.0 |
|
2022 |
7632 |
31.8 |
31.8 |
70.8 |
|
2023 |
5077 |
21.2 |
21.2 |
92.0 |
|
2024 |
1911 |
8.0 |
8.0 |
100.0 |
|
合计 |
23963 |
100.0 |
100.0 |
|
由折线图可以直观地看出,随着入学时间的推进借书量越来越大,尤其是在大一这一年,借书量增长迅速。大二开始借书的频率有所下降。但到了2022年大家开始上大三以后借书量开始骤然减少,当同学们慢慢进入大四借书量达到谷底。
3、各学院大学四年外借书籍类别分析
学院16的借书统计
类别 |
|||||
|
频率 |
百分比 |
有效百分比 |
累积百分比 |
|
有效 |
|
1 |
.0 |
.0 |
.0 |
马克思主义、列宁主义、毛泽东思想 |
53 |
.9 |
.9 |
1.0 |
|
哲学 |
237 |
4.2 |
4.2 |
5.2 |
|
社会科学总论 |
100 |
1.8 |
1.8 |
7.0 |
|
政治、法律 |
114 |
2.0 |
2.0 |
9.0 |
|
军事 |
17 |
.3 |
.3 |