利用先进技术来实现网络档案信息资源快速化采集的策略

互联网是一个信息资源宝库,其中拥有这各种各样的有价值资源,其中档案信息资源的也可以从网络上进行整合。档案信息资源的网络采集是档案馆信息资源开发的新形式,档案馆的开发人员必须掌握与档案信息网络采集有关的信息获取、网上档案馆选择、档案数据判选、转换与利用策略,熟悉网络采集环节,逐步向档案信息资源采集网络化过度。

1首先要有一个有目的完整的采集系统

网络档案信息资源毕竟是一个新生力量,作为一个学科来说,重视这些新事物是非常必要的,但同时,要在这方面做出成绩,因为没有太多资料可鉴,还比较难出成果,但也因为如此,少了很多的条条框框,反而不用害怕自己的意见有违传统。首先我们要有一个目标明确的采集系统,既然是网络档案信息,我觉得网络这个资源是非常值得重要的。在互联网上,档案信息资源的可信性和互联网信息的可信性是一致的,而互联网信息的采集目的与档案信息资源的采集目的是不同的。档案信息所要求的细节往往会被忽略掉。就像是情报采集系统一样,竞争情报所要求的细节一般会因为各种原因而被忽略掉,事实上这是由于情报采集策略有严重疏漏所造成的。一般的竞争情报系统软件都有手工信息采集模块,这一模块的作用在一般的企业中很难发挥,因为这需要一套情报工作制度和流程来保证。所以,我们的档案信息资源的采集系统一定要完整,而且要有目的性,只有这样,网络档案信息资源的采集才会有保障。而我们进行采集的目标是因为要丰富档案信息网站的内容,提高档案信息的利用价值。

2利用现有高科技,建立一个档案信息资源网络信息库

2.1想方设法提高档案信息资源的采集速度

各种档案数据的采集,是建立档案信息资源网络信息库的一项基础工作。档案信息著录、元件扫描、光盘存储的是采集网络数据的重要途径,但同时,其工作量也很大,需要投入相当大的人力、物力并加快采集速度,否则,实现网络化就无从谈起。因此,在现有条件下,各档案部门必须想方设法提高网络档案信息的采集速度,在现有的条件下,尽可能购置先进的技术设备,提高方案原件的扫描速度。

2.2以现有馆藏为基础,丰富充实档案信息资源网络信息库

从纸质文件管理的基础上,把它的收集、鉴定、整理、编目等方法加以完善,用到网络档案信息资源的建库上面。把现有馆藏通过档案著录、元件扫描、光盘存储等方式把鉴定好,认为可以上传的档案信息存入库中。采集数据还有一个非常重要的程序,在原始数据收集到一定的程度之后,还要加强档案信息资源的编研和开发,务必使能公开上网的档案信息,依照社会性、可用性、价值量、需求量和效益性原则,尽可能多的开发上网,保证每个档案室、档案局和档案馆站点信息的可读性和特殊性,提高访问者进入档案信息网的兴趣和几率。

2.3多方协调共享资源,丰富档案资源库

每个资源库的精力是有限的,侧重点也是不一样的,所以利用共享资源的模式,互相补充,一起丰富档案资源是很有必要的,现在面临的问题就是各个资源库的信息可能比较分散,结构也有较大差异,很难协调统一,面对这个问题,最好的方式是离线现在先进的网络信息采集技术,把异构数据同结构化,通过机器采集整理,最终形成统一的结构化资源库。

2.4及时更新档案信息资源网络信息库的内容

建立信息资源库之外,要及时更新丰富。人们需要从这个信息库中获得最新、最想知道的信息,如果久久不更新,恐怕这个库已经不能引起大家的兴趣了。就拿现在的网上炒得很热乎的《老徐的博客》来说吧,为什么她的博客能够有那么高的点几率,高居不下?主要原因是因为,上面的信息内容丰富:上有指点江山,激扬文字,中有娱乐圈的纷繁人生,下有徐静蕾作为一个普通的女生的点滴感悟。而她的博客更新速度也是极快,每一天的内容都不一样,让别人看到她的真诚、用心。当然,用明星博客跟我们的档案信息资源网络信息科来相比实在有点不敬,但是两者的道理是一样的。

3采集方法要掌握得当,必要时候,形成一套行之有效的系统的采集办法

3.1逻辑关系法

一般根据要档案信息收集鉴定活动程序或技术路线进行逻辑推理分析,依据各目标或环节间的逻辑关系或先后过程(或环节)采集必要的信息,并对程序中的对后续其它过程起基础作用的关键过程或环节进行重点信息采集,并利用这些关键过程或环节的执行情况信息来判断采集整体执行情况。这种方法要求首先必须明确各个目标或过程间的逻辑关系。

3.2分类采集法

在网络档案信息采集中,这种方法首先要求对网络信息需求所需要采集的信息进行分类,然后,依托该类别的评估专家或鉴定人员进行专项的信息采集。实行评估信息的分类采集,能够比较全面、详细地获取某一方面所需要的评估信息。

3.3追踪法

网络档案信息采集过程中,常常会由于某种因素,如被收集的信息内容不理想,被收集的档案的承担单位不配合或不积极配合,甚至故意阻碍或拖延,使得采集相关信息较为困难。在这种情况下,必须启用追踪法采集信息。这种方法通常以项目某一方面的执行情况为切入点,如档案的形成时间、地点、情况等,进行层层深入追踪调研,通过各种证据或材料来采集该方面的信息,直止完全或基本获取有关信息。在实际操作中,运用这种方法有一定的难度,它要求采集专家和鉴定人员要有强烈的责任心、坚定的信心和吃苦耐劳的精神。

3.4咨询法

咨询是获取信息的重要方法之一。咨询的对象一般包括档案形成者、所要鉴定档案的负责人。通过咨询活动,一般可获取结果不尽相同的信息,对这些不同源的信息进行去粗存细、去伪存真的思维加工,基本上就能得到比较清晰的真实信息。但采用这种方法的工作量较大。但是会使网络信息的道集到的丰富。

以上四种方法虽然各有特点,但它们之间不是孤立的,而是相互联系的。在网络档案信息采集过程中,往往是以某一种方法为主,其它方法为辅。究竟在何种情况下,采用何种方法要视具体情况而定,没有固定的模式。

确定了合适的采集方法后,一般分为两种实施方式,如果是机械性质的复制粘贴工作,可以交给软件或者完全外包来做,现在就有一些比较成熟的工具和服务商,比如深圳的易海聚,拓尔思;北京的方正等等。如果是需要人工来追踪的信息,那确实需要响应的人员来操作,综合两者的关系,可以大大的提高采集效率。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值