收藏本站
《吉林大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

数字图书馆资源聚合与服务推荐研究

刘健  
【摘要】:大数据环境下,以数字化存储与呈现、网络化检索与获取为特征的数字图书馆,成为集用户获取知识、传播知识、交流等多功能为一体的知识集散中心。各种数字对象(知识作为一种对象,可以表现为各种文献、事实/科研数据、数据库、知识库和知识体系)构成了可充分集成关联的数字图书馆领域的大数据环境,数字图书馆资源规模化增长是不可逆转的客观事实。随着数字图书馆资源的迅猛增加,以及智能技术的普及,推荐服务的智能化和个性化已经成为服务推荐发展的趋势。然而传统的个性化服务已经无法满足用户需求以及数字图书馆的发展。一方面,用户需求越来越复杂,如何准确描述和充分挖掘用户的个性化复杂需求,根据用户需求向其进行资源服务推荐成为难题;另一方面,数字图书馆资源数量巨大,如何有效对海量资源聚合并支持高效检索和推荐,充分挖掘数字图书馆资源内在的语义联系成为关注重点。数字图书馆资源"聚合"旨在发现资源之间及其内在的语义关联,通过系统汇聚、挖掘利用、有效整合多源异构的数字图书馆资源,构建一个内容相互关联、多维度、多层次的资源体系,形成集概念主题、学科内容和科研对象为一体的立体化知识网络;服务推荐作为一种有效的智能化信息过滤技术,能够结合数字图书馆资源的内容特征,通过对用户的兴趣偏好和资源访问行为进行自动分析与挖掘,主动向用户推荐满足其需求的数字图书馆资源。可见,基于数字图书馆资源聚合实现服务推荐已成为满足用户精准化需求的重要途径。本文以领域本体、数据挖掘、复杂网络理论及分析方法等技术和方法为基础,借鉴相应聚合及个性化推荐的成果,提出了面向用户复杂需求的资源聚合方法与服务推荐技术,为数字图书馆资源服务推荐提供相应参考。主要研究内容如下:(1)界定了数字图书馆资源聚合及服务推荐概念,分析了数字图书馆资源聚合同服务推荐之间的关系。数字图书馆资源聚合是服务推荐的基础,服务推荐是数字图书馆资源聚合的目标。服务推荐又从用户需求方面引导聚合的质量,更进一步揭示了学科领域的知识结构与发展规律,从而能够在提高数字图书馆资源聚合能力和效率基础上满足用户个性化需求、提升服务推荐效果。(2)阐述了数字图书馆资源语义化概念,分析了数字图书馆资源语义化、语义关系以及数字图书馆资源的文本语义距离。语义概念和语义关系构成了数字图书馆资源聚合的基础,将领域本体看做由节点(语义概念)和弧线链(语义关系)组成的带有标记的有向网络。基于复杂网络理论对其进行分析,深度揭示概念之间的网络关系,进而挖掘、建立、利用资源之间的联系,将繁杂、无序的内容通过聚合以呈现关联性。(3)对数字图书馆资源聚合的特征、维度等问题进行系统研究,综合运用复杂网络理论及其指标、语义相似度计算等理论方法和工具,构建了数字图书馆资源聚合模型。总结了数字图书馆资源聚合的特征:数字图书馆资源聚合对象的多元化、数字图书馆资源聚合方法的多样化、数字图书馆资源聚合维度的立体化以及数字图书馆资源聚合过程的动态化。在此基础上,提出了数字图书馆资源聚合模型。该模型框架包括数据资源层、资源语义化层、资源聚合层、应用层四个层次,即从数字图书馆资源甄选及资源语义化(微观)到资源的系统汇聚(中观)再到资源的深度挖掘与利用(宏观)。(4)分析了基于维基百科构建的领域本体的网络结构,结合复杂网络指标中的度、集聚系数等指标测度提出了重要节点识别方法,以此作为聚合的基础。依据D-S证据理论,在识别框架(high,low)下构建基本概率分配函数,表示节点重要性程度,通过D-S证据理论合成公式进行合并,以概率的形式对节点重要性进行量化,并得到节点重要性的评价指标。对构建的领域本体进行分析,发掘网络的重要节点,能够为充分挖掘本体的语义信息、发现本体中的隐含知识、对特定领域的相关知识结构进行分析和呈现、解决领域知识共享等问题提供方法和参考。(5)通过改进基于本体的语义相似度计算方法以及基于《同义词词林扩展版》的语义相似度计算方法,提出了改进的谱聚类算法。在资源聚合中应用文本聚类分析的方法,从资源内部以及外部特征出发,利用资源聚合原理使资源呈现出集簇状,进而根据资源呈现出的层次簇状结构为之选择一种或多种合适的表示结构,从而深入地挖掘出隐含在资源之间的语义关系。(6)提出了 3种服务推荐方法:基于本体规则推理和语义相似度计算的服务推荐方法、基于关联语义链的服务推荐方法、基于谱聚类的服务推荐方法。通过对数字图书馆资源有效聚合,将资源语义化并进行语义关联,在此基础上,挖掘用户需求信息,根据用户偏好对其进行推荐。实验结果表明:在对数字图书馆资源聚合的基础上利用服务推荐方法对用户进行推荐,可以提高推荐准确性,使得推荐结果更加符合用户对于数字图书馆资源的偏好。利用本体、数据挖掘以及服务推荐等方法,对数字图书馆资源聚合以及服务推荐进行研究,为资源聚合与服务推荐的深入研究搭建了一个新的框架,从而为优化其资源再组织结构和提升知识服务能力提供有价值的参考与指导。(7)将知网文献资源作为数据源,验证了本文第4章和第5章所提出的聚合和推荐方法,从技术实现的角度采用JAVA语言和MYSQL数据库开发设计了数字图书馆资源服务推荐应用平台。该系统采用C/S系统架构,集成了本文所提出的聚合方法和推荐方法,实现了数字图书馆资源聚合及服务推荐功能。以聚合为基础为用户进行服务推荐的方法解决了传统推荐方法对用户需求挖掘不充分、冷启动以及数据稀疏等问题,实现了推荐结果与用户个性化需求的高度匹配,并提高了推荐精度,进一步扩展了数字图书馆未来开展知识服务的新视野。
【关键词】:数字图书馆资源 资源聚合 服务推荐 资源语义化
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:G250.76
【目录】:
  • 摘要4-7
  • Abstract7-14
  • 第1章 绪论14-46
  • 1.1 研究背景和研究意义14-18
  • 1.1.1 研究背景14-17
  • 1.1.2 研究意义17-18
  • 1.2 国内外研究现状18-40
  • 1.2.1 数字图书馆资源聚合国内外研究现状19-26
  • 1.2.2 服务推荐国内外研究现状26-40
  • 1.3 研究内容与研究方法40-44
  • 1.3.1 研究内容40-41
  • 1.3.2 研究方法41-42
  • 1.3.3 技术路线42-44
  • 1.4 本文创新点44-46
  • 第2章 研究范畴界定与理论方法46-72
  • 2.1 研究范畴界定46-49
  • 2.1.1 数字图书馆资源聚合46-47
  • 2.1.2 服务推荐47-48
  • 2.1.3 数字图书馆资源聚合与服务推荐的关系48-49
  • 2.2 研究理论基础49-59
  • 2.2.1 认知语言学理论49-52
  • 2.2.2 本体理论52-56
  • 2.2.3 复杂网络理论56-59
  • 2.3 研究方法59-70
  • 2.3.1 数字图书馆资源聚合方法59-64
  • 2.3.2 服务推荐方法64-70
  • 2.4 本章小结70-72
  • 第3章 数字图书馆资源聚合模型构建研究72-86
  • 3.1 数字图书馆资源语义化及语义关系分析72-78
  • 3.1.1 数字图书馆资源语义化72-74
  • 3.1.2 数字图书馆资源语义关系74-76
  • 3.1.3 数字图书馆资源文本语义距离计算及语义化76-78
  • 3.2 数字图书馆资源聚合模型构建78-84
  • 3.2.1 数字图书馆资源聚合模型构成要素78-80
  • 3.2.2 数字图书馆资源聚合模型特征80-83
  • 3.2.3 数字图书馆资源聚合模型的体系框架83-84
  • 3.3 本章小结84-86
  • 第4章 数字图书馆资源聚合方法研究86-118
  • 4.1 领域本体构建及其网络结构分析86-100
  • 4.1.1 领域本体构建86-89
  • 4.1.2 领域概念获取89-94
  • 4.1.3 领域本体结构分析94-100
  • 4.2 复杂网络重要节点发现100-106
  • 4.2.1 复杂网络重要节点建模100-103
  • 4.2.2 复杂网络重要节点识别及判定算法103-106
  • 4.3 语义相似度计算106-112
  • 4.3.1 基于领域本体的概念语义相似度计算106-108
  • 4.3.2 基于《同义词词林扩展版》的语义相似度计算108-111
  • 4.3.3 数字图书馆资源文本语义相似度计算111-112
  • 4.4 改进的谱聚类算法112-116
  • 4.4.1 算法原理与步骤112-113
  • 4.4.2 实验结果及分析113-116
  • 4.5 本章小结116-118
  • 第5章 数字图书馆资源服务推荐研究118-138
  • 5.1 基于本体规则推理的数字图书馆资源服务推荐118-123
  • 5.1.1 算法原理与步骤118-121
  • 5.1.2 实验结果及分析121-123
  • 5.2 基于关联语义链的数字图书馆资源服务推荐123-130
  • 5.2.1 算法原理与步骤125-128
  • 5.2.2 实验结果及分析128-130
  • 5.3 基于谱聚类的数字图书馆资源服务推荐130-136
  • 5.3.1 算法原理与步骤130-134
  • 5.3.2 实验结果及分析134-136
  • 5.4 本章小结136-138
  • 第6章 数字图书馆资源聚合与服务推荐实证研究138-164
  • 6.1 知网文献资源聚合及服务推荐流程138-150
  • 6.1.1 重要节点发现139-146
  • 6.1.2 知网文献资源聚合146-148
  • 6.1.3 知网文献资源推荐148-150
  • 6.2 数字图书馆资源服务推荐原型系统实现150-163
  • 6.2.1 原型系统设计的总体框架150-151
  • 6.2.2 系统功能模块设计151-153
  • 6.2.3 系统开发环境及运行环境153-154
  • 6.2.4 系统功能模块展示154-163
  • 6.3 本章小结163-164
  • 第7章 研究结论与展望164-170
  • 7.1 研究结论164-168
  • 7.2 研究局限与研究展望168-170
  • 7.2.1 研究局限168
  • 7.2.2 未来展望168-170
  • 参考文献170-188
  • 在学期间的攻读成果188-190
  • 致谢190-191

中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026