|国家预印本平台
首页|基于微博的细粒度情感分析

基于微博的细粒度情感分析

中文摘要

【目的】对微博进行细粒度情感分析, 将情感分为 8 类, 并计算其情感强度值, 从而尽可能还原微博用户情感。【方法】通过微博语料分析构建疑问词词表, 在大连理工大学情感词汇本体 DUTIR 的 7 类情感基础上, 丰富一类情感“疑”, 并利用点互信息法构建表情符号词典, 还综合考虑否定词和程度副词对情感表达的影响, 利用Python 从新浪微博上获取数据, 并用 R 语言的 jiebaR 包进行分词, 对情感进行分类并计算其强度。【结果】得到微博用户对于糖尿病 7 类常用药物的 8 类情感占比及情感强度, 并通过正确率、召回率、F 值对结果进行验证, 其中“怒”和“哀”的正确率最高, 分别为 85.73%和 83.05%, 而“乐”和“好”的召回率与 F 值均最高, 为 81%以上。本文新增情感“疑”的正确率、召回率、F 值分别为 77.33%、78.58%、77.95%, 均值在 8 类情感中排名前列, 说明其情感识别较好。【局限】由于本文依赖于情感词典进行情感分析, 因此为了更好的分析结果, 情感词典仍需进一步完善。【结论】本方法具有较高的识别率和可靠性, 能够更好地对微博上的情感分类进行细粒度分析。

敦欣卉、杨铠西、张云秋

10.12074/201712.01605V1

医学研究方法计算技术、计算机技术

微博细粒度情感分析药物

敦欣卉,杨铠西,张云秋.基于微博的细粒度情感分析[EB/OL].(2017-11-30)[2025-08-18].https://chinaxiv.org/abs/201712.01605.点此复制

评论