资源发现系统中基于多源数据融合的文献元数据质量提升
[目的/意义]构建面向多源文献元数据的数据融合模型,以提升发现系统中元数据的质量,进而为用户体验良好的文献发现服务组织奠定数据基础。[方法/过程]首先分析文献元数据存在的代表性质量问题及成因,在此基础上构建多源文献元数据融合模型,包括元数据著录规则及质量分析、数据预处理、基于多元数据项的数据判重、元数据内容融合策略体系,最后通过实验验证模型效果。[结果/结论]实验表明,模型在元数据判重环节的准确率和召回率分别达到99.9%和99.2%,均高于对照组;完成元数据内容融合后,题名、作者、摘要、页码等元数据项的质量均有明显提升。
林鑫、李想、李静
华中师范大学信息管理学院湖北省数据治理与智能决策研究中心湖北省数据治理与智能决策研究中心
图书馆、情报与文献学
文献资源发现系统,文献元数据,元数据质量,数据融合
林鑫,李想,李静.资源发现系统中基于多源数据融合的文献元数据质量提升[EB/OL].(2022-06-28)[2024-09-19].https://sinoxiv.napstic.cn/article/3444777.点此复制
评论