2010年认证杯SPSSPRO杯数学建模
C题 高校图书馆的智能服务
原题再现:
图书馆源于保存记事的习惯。图书馆是为读者在馆内使用文献而提供的专门场所。而高校的图书馆为教学和科研服务,具有服务性和学术性强的特点。
现在的高校图书馆存在着许多不良的现象,比如对书籍的损坏、借阅超期等。在搜索引擎下输入“图书超期”等关键字,成千上万的网页被检索出,大多都是超期读者的信息列表。超期现象是读者借阅图书资料时超过规定借阅期限后不归还的一种普遍现象。处理超期罚款是流通服务中常遇到的事,特殊情况则需酌情处理。这一现象虽是小事,但处理不当会影响图书馆与读者之间的关系,从而影响图书馆的声誉,以及馆藏资源的利用率,最终影响图书馆功能的正常发挥。
随着信息化的发展,图书的预约服务也逐渐普及。图书的预约与借阅超期的现象也有很大的内在联系。试通过数学模型来研究以下的问题:
第一阶段问题:
(1) 对于借阅图书超期,原因众多。考虑到高校的特点,大体上可以把超期原因分为三类:1、无意错过还书期限;2、由于教学科研需要,长期使用;3、由于罚款数目较少,所以故意拖延。请通过给出的数据或自行查找相关数据,建立合理的模型,分析哪些书容易发生超期现象,以及当发生超期时,分析其可能的原因。以便图书馆采取相应的措施改进服务。
(2) 假设某高校的借书规则为:借书时限为 1 个月,可以续借一次,续借时限为 15 天,超期一天罚款 0.1 元。试根据问题 (1) 中的模型评价这种借书规则的优劣。请设计一种更加合理的借阅规则。
整体求解过程概述(摘要)
高校图书馆超期现象普遍存在,能否合理的分析超期想象的原因及制定更加完善的借阅规则关系到高校图书馆资源的利用以及发展。
本文首先分析了影响书籍超期易度指标的主要因素,即超期天数和人均超期书数,然后对这两个主要因素进行数据收集。由于各类高校的情况有所差异,我们选取了郑州作为研究对象。
问题1中,本文分别基于书均超期天数和人均超期书数对各类图书的超期易度排序,结果十分吻合,相互应正。得到 p(天文、地球科学)类图书的超期度最高。为了使模型更加的完善,本文基于粗糙集理论对前面得出的超期易度排序进行合理的调整。接着,根据影响图书超期现象的三种主要原因及其指标特点,分析数据,得出指标值,应用系统聚类法、熵值法基于指标值将超期图书分为三类,由于相同的数据来源,分析得到三种主要原因与三种图书类别存在对应关系,本文便巧妙应用统计聚类模型。结合超期天数分布条形图特点,确定这种对应关系,从而得出不同类别图书的超期原因。
问题 2 中,我们主要从规则的针对性强弱,对提高图书利用率的贡献度两方面评价借阅规则的优劣。发现其忽略了读者的差别,书籍的类型、将图书规则定为“静态”。据自动化控制理论中的中的开环控制系统和闭环控制系统原理,将其视为开环控制系统。
针对开环控制系统的弊端,首先根据类别确定借阅规则,接着建立了双闭环反馈模型对其完善。引入了读者诚信度的概念。第一,对借阅天数与借阅时限进行比较,反馈调节超期天数。超期天数通过反馈环节对读者诚信度进行更新。第二,超期天数通过系统中的调解元件得到初级罚款指数,再结合读者诚信度,得出综合借阅指数。接着本文利用博弈论的方法对罚款金额、图书馆催还制度、续借天数与超期天数进行分析。通过综合借阅指数对罚款金额、图书馆催还制度、续借天数的幅度合理的控制,可以控制超期问题,制定出基于差异读者、差异图书的较合理的借阅方案。
问题分析
超期现象普遍存在,各高校图书馆对此问题采取了一定的措施,但效果不明显。研究图书超期的文献大都停滞在简单调查总结,定性描述阶段。我们建立模型讨论研究了该问题,充分挖掘数据的信息,给出了定量计算与定性分析结合的方案。首先,我们对常见催还清单的数据选取了书均超期天数、人均超期书数等指标来刻画图书的超期易度并对郑州大学的催还清单数据,编程统计指标值。借用《图书分类法》对图书分成 22 大类,下面的工作都是针对各类分别讨论。
问题 1,基于书均超期天数、人均超期书数确定的各类图书的超期易度排序,十分吻合,相互应正。结果显示郑大的 p(天文、地球科学)类图书的超期度最高。然后我们引进粗糙集理论对前面得出的超期易度排序进行调整。
问题 2,影响图书超期的因素较多。原因大致可分为无意型、故意型、确实急需型三类。据统计数据显示,无意型占 50%,读书习惯影响占 15%,教学安排占 10%,借阅制度占 15%,图书互借约占 10%。可见无意型极具普遍性。我们跟据多方面的文献总结出影响图书超期的三个主要原因类型及其指标特点,然后对数据统计其指标值,应用系统聚类法、熵值法仅基于数据把超期图书分为三类,我们认为,既然三个原因类型与仅以数据统计算出的类别针对相同的对象的相同研究属性,那么这两个三类之间一定存在一一对应关系,这样寻找原因问题就巧妙转化为求适当的统计聚类方法。结合超期天数分布条形图特点,很容易确定这种对应关系,从而给出了不同类别图书的不同超期原因。
问题 3,我们主要从规则的针对性强弱,对提高图书利用率的贡献度两方面评价借阅规则的优劣。发现郑大的借阅规则存在很多不足。由于借阅规则“一刀切“,没有考虑读者的差别、不同类书的差别,据自动化控制理论中的中的开环控制系统和闭环控制系统原理,改系统属于开环控制系统。
针对开环控制系统无针对性的弊端,我们建立了双闭环反馈模型。引入了读者诚信度的概念。第一,对借阅天数与借阅时限进行比较,反馈调节超期天数。超期天数通过反馈环节对读者诚信度进行更新。第二,超期天数通过系统中的调解元件得到初级罚款指数,再结合读者诚信度,得出综合借阅指数。接着本文利用博弈论的方法对罚款金额、图书馆催还制度、续借天数与超期天数进行分析。通过综合借阅指数对罚款金额、图书馆催还制度、续借天数的幅度合理的控制,可以控制超期问题,制定出基于差异读者、差异图书的较合理的借阅方案。
模型的假设:
1. 认为图书馆系统经过长时间的运作,已经是稳定系统,存书比例与需求比例大体吻合。
2. 影响超期原因因素很多,但数据难于收集,故我们只选取一些方面研究,虽然不全面但认为合理。
3. 假设诚信度可以从读者的超期图书数量和超期天数反映。
4. 假设可以从获取读者的借阅历史情况,包括读者的超期图书数量和超期天数。
5. 假设查到的全国平均罚款金额准确。
6. 假设高校的图书馆有能力采取本文提出的催还方法。
论文缩略图:
全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可
部分程序代码:(代码和文档not free)
clc,clear
a=[119,127;75,112;99,134;98,220;63,63;37,76;42,82;63,90;80,118;61,110
69,93;120,120;107,158;332,480;52,80;83,176;73,173;24,40;81,99;53,53];
y=pdist(a,'cityblock');yc=squareform(y)
z=linkage(y);
[h,t]=dendrogram(z)
set(gca,'yscale','log','ylim',[0 1000])
%%首先导入数据文件 matlabsuju.Mat
%下面编写函数
function majian (a_x)
y=a_x(1,:);
z=a_x(2,:);
y1=floor(y/10000);
y2=floor(mod(y,10000)/100);
y3=mod(y,100);
riqi=[y1;y2;y3];%借书日期
chaoqi=datenum(2010,3,30)-datenum(y1,y2,y3) ;%%每本书超期时间列表
shujuncqts=sum(chaoqi)/length(chaoqi);%平均每本书超期天数
shujuncqts=floor(shujuncqts);%取整
bar(chaoqi)%画条形图
chaoqi1=sort(chaoqi);
plot(chaoqi1)
hist(chaoqi,50)%画直方图
%%%%%%%下面计算该类借书人数 n+1
n=0;
z=sort(z);
for i=1:length(y)-1
if z(i+1)~=z(i)
n=n+1;
end
end
renshu= n+1;
renjuntianshu=floor(sum(chaoqi)/(n+1));
[renshu;renjuntianshu;shujuncqts]'%给出输出参数矩阵
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%