|国家预印本平台
首页|查询意图自动分类的新方法探讨

查询意图自动分类的新方法探讨

A New Approach to Automatic Classification of Query Intent

来源:istic_logo国家预印本平台
中文摘要英文摘要

[目的]基于Sogou查询日志数据实现查询意图的自动识别。[方法](1)将ODP主题类目体系映射到Rose等的意图类目体系,利用启发式和本体匹配的方法形成标注规则,对查询进行自动标注;(2)利用LTP工具提取查询的自然语言层面特征,包括:分词特征、词性特征和词之间的句法依赖关系特征,同时也提取出了查询的统计和用户行为特征;(3)基于所标注的查询日志数据集以及所提取的特征,利用GBDT实现查询意图的自动识别。[结果](1)本文提出的自动标注规则所标…查看全部>>

[Objective] In this paper, we achieve automatic identification of query intent based on Sogou query log data. [Methods] (1) We map the ODP subject class system to Rose's intention class system, using the heuristic and ontology matching method to form annotation rules, and automatically mark the query; (2) We use the LTP tool to extract the natural language level features of the query, including: the characteristics of the word segmentation, the part of speec…查看全部>>

贺国秀、张晓娟

10.12383/202206270053V1

计算技术、计算机技术

GBDT机器学习查询日志查询意图自然语言处理

GBDTMachine LearningQuery logQuery IntentNature Language Processing

国家自科基金 基于语言模型的通用实体检索建模及框架实现研究( 71173164 ) 国家社科基金 融合用户个性化与实时性意图的查询推荐模型研究( 15 CT Q019 )

贺国秀,张晓娟.查询意图自动分类的新方法探讨[EB/OL].(2022-06-29)[2025-04-03].https://sinoxiv.napstic.cn/article/3444792.点此复制

评论

您当前未登录!去登录点击加载更多...