计算机情报检索

利用计算机情报检索系统存储和查找情报的技术,是计算机硬件资源、系统软件、检索软件和存储情报的数据库的总合。

计算机情报检索按处理方式可分为:脱机检索和联机检索。前者又可分为查找新到情报资料的定题情报检索(SDI) 和就某一课题查找已积累的情报资料的回溯检索,后者又可分为查找新到情报资料的联机SDI 和查找已积累情报资料的联机回溯检索。

脱机检索

20世纪50年代末,美国最早出现的计算机情报检索方法是顺序检索,利用磁带作为主要的文献信息存储载体。由于磁带结构上的某些特点,要查明磁带上哪些文献信息符合要求,必须让计算机对磁带中存储的文献信息按顺序逐篇地进行判别处理,然后才能把符合要求的文献信息,即检索结果,提交给用户。顺序检索法乍看起来似乎很笨拙,但是由于计算机的高速处理能力,它比手工检索已经快了很多。但检索效率仍较低。后来,人们把一批课题编成一个提问档,交付给计算机一次处理,这样做一盘磁带只要转一遍就可以查找出一大批课题提问的相关文献信息集合,把顺序检索的效率提高了许多倍。这种把成批顺序检索方式用于查找新到情报资料,叫做SDI。采用SDI方式,情报服务机构将最新收到的文献磁带,连同用户的检索要求编成的检索提问档一并提交给计算机进行脱机批处理式顺序检索,然后将检索结果分别提供给有关用户。 SDI不仅可以定期地向用户提供他感兴趣的最新情报,而且费用相当便宜,所以直至今日,它仍是最受欢迎的计算机情报检索服务方式之一。把一批用户的检索课题制成用户提问档,用脱机成批处理方式从已积累起来的磁带数据库中顺序追溯查找各课题需要的情报资料,将命中文献打印出来提供给各个用户,叫做回溯情报检索。脱机回溯情报检索是联机情报检索系统出现以前的产物,由于这种检索方式费用高,所用时间长,一般已不采用。

联机情报检索

分联机SDI和联机回溯情报检索两类。联机SDI 是用户利用联机情报检索系统定期查找数据库中新追加的情报资料的一种检索方式。联机情报检索系统的数据库所存储的情报数据,通常是按时间顺序积累的,检索时,可以一次遍查所积累的全部情报数据。对于想查找某一课题数据库中新增加情报资料的用户来说,每次都查找出全部情报资料是一种浪费,即使能按时间查找,每次都要输入相同的提问式,也很不方便。这样的用户可以利用联机SDI 功能进行检索:用户通过终端把检索课题内容建成提问档存入联机检索系统,每次检索时,只要输入提问档编号即可找到数据库中新追加的情报资料。由于联机数据库是按时间顺序不断积累建立的,所以联机检索通常都是回溯检索。联机情报检索允许用户通过终端和计算实现面对面的人机对话,用户用键盘把他的检索要求输入计算机,计算机则把它对用户提问的响应,包括各种提示和检索结果,在屏幕上显示给用户。在联机检索过程中,允许用户随时修改他的检索策略,直到满意为止。联机检索一般得先查找索引倒排档,从而得知与检索要求相符的文献信息集合在磁盘上的存储地址,因为磁盘是一种随机存储器,当计算机已经知道了所需信息的存储地址后,就可以让磁头快速移动到相应的磁道位置,直接把有关信息读出来,并通过屏幕显示或打印检索结果。由此可见,联机检索克服了脱机批处理式顺序检索的大部分缺点,使用灵活方便,检索效率高,检索结果一般是立等可取。

随着联机检索和计算机通讯网络技术的发展,从70年代开始,先是在北美,然后是在西欧等发达国家,相继出现了DIALOG、ORBIT、ESA/IRE等世界规模的计算机联机情报检索中心,它们都配备了规模巨大的先进计算机,拥有存储容量在数十万兆字节以上的磁盘机,在全世界各地设置了数以万计的检索终端。人们几乎可以在任何时间和地点(包括在中国各地),就可通过这些终端检索存储在这些计算机里的数以百计的、学科门类齐全的数据库。通常一个检索课题只要花几分钟时间就可以完成全部检索操作。其检索结果可以在本地打印机上即时打印输出。为节省联机检索费用,用户也可以命令联机检索服务中心将检索结果脱机打印后邮寄。

中国的计算机情报检索事业起步较晚。1975年,开始引进国外文献磁带进行SDI试验。从1975年起,用3年时间编制了《汉语主题词表》,开始研制汉字信息处理系统,为建立情报检索系统打下了一定基础。从80年代起,中国情报图书部门建立了一批西文SDI系统和若干大型联机情报检索系统,在数十个城市建立了国际联机检索终端。由于受到汉字信息处理技术进展缓慢等因素的限制,汉字情报检索系统的建立进展缓慢。80年代中期,汉字信息处理技术取得突破性进展。目前,已建立了数十个汉字数据库,在数百个小型、微型计算机上建立了情报检索系统,开始实现汉字情报检索。