首页|一种分布式语义增强的词汇链文本表示模型构建方法

一种分布式语义增强的词汇链文本表示模型构建方法

来源：

中文摘要

【目的】利用分布式语义关联计算词衔接关系, 解决目前词汇链构建时存在的词间关系探测深度不够等问题, 提高词汇链构建质量。【方法】对词汇链构建的技术方法进行归纳, 利用 WordNet 词典关系来计算文本中语言单元的语义关联, 利用分布式记忆模型来计算语言单元之间的潜在语义关系, 将这两种语义关系结合起来实现词汇链文本表示模型的构建。同时在理论研究的基础之上选择医学领域科技论文进行对比实验。【结果】在文本主题描述方面, 本文方法的词汇链构建结果要优于非贪婪算法, 算法耗时与非贪婪算法相当。【局限】算法耗时较长; 没有完整考虑词衔接关系; 只在对医学领域科技文献的主题识别中验证了该方法的有效性, 还需要在更多领域进行证明。【结论】分布式语义关联可以识别潜在语义, 对使用多元短语构建词汇链也有较大的帮助, 能有效地增强词汇链构建效果。

作者：王文玲、曲云鹏

作者单位：

DOI：10.12074/201711.02044V1

学科分类：语言学计算技术、计算机技术基础医学

中文关键词：WordNet分布式记忆词汇链分布式语义

推荐引用：王文玲,曲云鹏.一种分布式语义增强的词汇链文本表示模型构建方法[EB/OL].(2017-11-08)[2025-08-02].https://chinaxiv.org/abs/201711.02044.点此复制

一种分布式语义增强的词汇链文本表示模型构建方法

评论