从计算机领域的研究角度出发,数字图书馆的研究和开发的若干关键技术如下。
1.数字图书馆系统结构模型:
数字图书馆是一个相当复杂的系统,必须有统一、规范和系统化的模型作为研究和开发数字图书馆的理论指导和前提。对数字图书馆模型的研究,根据建模侧ZD不同,可以将系统模型分为:结构模型、框架模型、动态模型、过程模型和功能模型。这五种模型各有所长,如何将其有机地结合和统一,形成对数字图书馆的相对完整刻画,还需要做许多的研究工作。
2.数字图书馆资源管理:
数字图书馆研究和建设的迅速发展,系统资源和信息资源已经显得非常重要,如何更加有效、合理地管理和利用有限的系统资源(cpu线程、i/o进程、缓冲区和网络处理)和信息资源满足数字图书馆的各种需求,是资源管理研究的主要内容。其中包括资源管理的机制和策略、管理模型和优化算法等。目前针对这个问题已经提出的解决方法:服务质量概念以及利用qos机制来解决该问题的方法;基于元调度方法“装箱”方案;基于数字图书馆的三层模型和多媒体协商、cpu调度、缓冲区分配和差错控制等方法。
3.分布式多媒体同步:
在数字图书馆的通信中有时不仅要求实时、等时地传输多媒体数据,而且要求各种媒体对象间保持时间和空间的同步约束。实时性、等时性和同步性是多媒体通信的基本特点,也是实现多媒体通信的关键技术和基础。同步性要求各种媒体在传输后仍然保持原来时间和空间上的制约关系。目前国际上关于多媒体同步模型的研究可分为时间线模型、层次模型和参考点模型三类。各种媒体信息时态关系的研究也是多媒体同步中重要组成部分。目前多媒体同步模型的研究比较深入,人们提出了不少模型,但还没有一种比较完善的、能够满足数字图书馆通信要求的分布式多媒体同步模型。
4.多媒体数据库:
多媒体数据库技术是以有效管理大量多媒体数据和相关信息为目标的数据库系统,它是开发数字图书馆的关键技术之一,是多媒体、图像处理和识别、人工智能和数据库技术相结合的产物。数字图书馆的媒体资源内容的组织方式将与传统的方式不同。其内容将按照用户需求挑选的高价值知识内容,经过分类、编辑、整理、加工,变成受教育者易于接受的形式。它是一种有很大增值的有序的知识库,会出现新的知识产权关系。数字图书馆将资源分为元数据和对象数据。对象数据是指数字化的文本、图像、声音、影像等,元数据则是那些描述和管理对象数据的数据。对象数据呈分布式存放在各地的资源点内,元数据则有必要集中在数字图书馆ZX的超大规模服务器上,用户查询时,ZX调度系统通过元数据调度各对象数据库数据以提供服务。
5.基于内容的信息检索:
基于内容的检索技术是多媒体数据库的重要组成部分,是目前数字图书馆研究的热点关键技术之一。所谓基于内容的检索是指根据媒体对象的语义和上下文联系进行检索。其特点在于:从媒体内容中提取信息特征。即对图像、视频、音频进行分析和特征提取,利用这些内容建立特征矢量作为索引进行检索;是一种基于媒体多维特征进行的近似性匹配,是一种信息检索技术。该技术将支持从数字图书馆的多媒体数据库中以用户可以接受的响应速度查询到所要求的信息。
6.数据压缩:
该技术是信息科学的关键技术及基础理论问题,同时也是建设数字图书馆系统的关键技术。压缩编码的理论基础是信息论。从信息论的角度看, 压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。编码方法可以分成三类:(1)考虑图像信源的统计特性。采用预测编码方法、变换编码方法、矢量量化编码方法、子带-小波编码法、神经网络编码法等。(2)考虑人眼视觉特性。采用基于方向滤波的图像编码法、基于图像轮廓-纹理的编码法。(3)考虑图像传递的景物特征采用分形编码方法、基于模型的编码方法。
7.网络:
在数字图书馆系统中,多媒体信息的存取、查询、检索和表现要求具有服务质量(qos)保证的通信网络。qos包括网络的吞吐量、带宽、允许的延迟、抖动和差错率等参数。设计一种综合的协议体系