|国家预印本平台
首页|基于LDA 挖掘计算机科学文献的研究主题

基于LDA 挖掘计算机科学文献的研究主题

中文摘要

【目的】运用文本挖掘技术自动从海量科技文献中提取研究主题并探测其研究趋势。【方法】以《中文核心期刊要目总览(2014 年版))—“TP 自动化技术、计算机技术”栏目前10 种期刊刊载的计算机科学类(Computer Science)文献为研究对象, 借助LDA 主题模型, 考虑科技文献的发表时间信息, 挖掘出典型话题, 并根据主题强度分析主题的演化趋势。【结果】18 个研究话题中有7 个主题强度上升的主题和6 个主题强度下降的主题。【局限】仅分析了国内计算机领域的前10 种期刊, 期刊范围不够大, 也未考虑国外计算机领域的期刊文献。【结论】该方法能够深入挖掘计算机领域期刊文献的话题, 帮助从事该领域研究的学者了解主题的演化趋势并寻找新兴研究主题。

高宝俊、杨海霞、孙含林

10.12074/201711.02020V1

计算技术、计算机技术

计算机科学LDA主题提取主题强度文档聚类

高宝俊,杨海霞,孙含林.基于LDA 挖掘计算机科学文献的研究主题[EB/OL].(2017-11-08)[2025-08-18].https://chinaxiv.org/abs/201711.02020.点此复制

评论