社会化标注环境下基于活跃度指数的图书特色挖掘研究
对图书特色进行挖掘和展示,有利于减轻图书数量的爆炸性增长为读者选书带来的困扰。随着Web2.0 的发展,产生了一批规模较大的社会化图书标注系统,并积累了大量的标签,这为图书特色全面挖掘带来了契机。以社会化标签为基础数据源,本文提出了基于活跃度指数的图书特色挖掘模型,并以国外知名图书社会化标注系统LibraryThing中1206本科幻小说的标签数据为例进行了原型实现。从原型系统效果看,96.77%的图书能够基于该策略挖掘出至少一个特色标签,平均为6.5个;通过与SF Signal网站的专家总结的图书特色相比,该策略能够覆盖专家分析特色的77.2%,且绝大部分非重合标签也反映了图书的特色,因此该策略能够较好地实现图书特色挖掘。
林鑫、石宇
武汉大学信息管理学院武汉大学信息管理学院
图书馆、情报与文献学
社会化标签 活跃度指数图书特色数据挖掘
林鑫,石宇.社会化标注环境下基于活跃度指数的图书特色挖掘研究[EB/OL].(2022-06-28)[2024-12-22].https://sinoxiv.napstic.cn/article/3444780.点此复制
评论