|国家预印本平台
首页|科技文献副主题词抽取及其在分面检索中的应用

科技文献副主题词抽取及其在分面检索中的应用

来源:istic_logo国家预印本平台
中文摘要

在进行文献检索时,用户一般仅关注某一主题的某个或某些方面,而副主题词反映了一篇文献主要研究了其主题的哪个方面,因而对科技文献检索具有重要意义。但在以往的中文科技文献标引时,一直都忽视了副主题词的标引。为实现副主题词的自动标引,本文提出了以标题作为抽取数据源、基于规则进行抽取的实现方法,并以图情领域文献进行了实验。结果显示,基于规则的抽取方法在召回率和准确率方面表现良好,均超过了90%;但仅以标题作为抽取数据源会导致召回率偏低,仅有49.9%的文献能抽取出副主题词。最后,本文以图情领域文献为例构建了分面检索原型系统,并将副主题词作为检索入口和分面应用于其中,从效果来,副主题词作为独立的检索点价值不大,但和其他检索点配合使用则可以更贴切地表达用户需求,作为分面则能在帮助用户进行探索式检索以及结果筛选方面发挥重要作用。

胡昌平、林鑫、陈果

武汉大学信息管理学院武汉大学信息管理学院

10.12383/202206270034V1

图书馆、情报与文献学

自动标引副主题词分面检索

胡昌平,林鑫,陈果.科技文献副主题词抽取及其在分面检索中的应用[EB/OL].(2022-06-28)[2024-12-22].https://sinoxiv.napstic.cn/article/3444776.点此复制

评论