|国家预印本平台
首页 > 星级预印本
  • 21.中美图情领域开放获取论文影响力扩散研究

    作者:魏明坤;袁伟

    摘要: 【目的/意义】大科学时代,开放获取在学术交流中承担着重要角色,对学术知识传播和创新起到推动作用,加快开放科学与学术成果的社会化进程,分析开放获取论文影响力扩散,有利于开放获取论文影响力的细粒度评价。【方法/过程】本文从开放获取论文交流传播视角,通过开放获取论文知识网络、产出水平以及Altmetrics活跃度对中美图情领域开放获取论文影响力扩散进行分析。【结果/结论】研究发现中美图情领域开放获取论文在交流传播过程呈现的知识网络、产出水平及Altmetrics活跃度方面存在差异性。【创新/局限】本文从学术交流角度出发,通过论文发表后的使用情况及产出水平揭示中美图情领域开放获取论文影响力的扩散,在未来的研究中还需进行影响力扩散细粒度分析,对影响力扩散呈现的知识单元进行全面深入探索。

    2022-06-29 16:14:06

    10.12383/202206270045V1

    国家预印本平台_logo国家预印本平台

  • 22.基于映射方法对比的受控词表互操作质量影响因素研究

    作者:赵洁;贾君枝

    摘要: [目的/意义]通过对现有映射方法的归纳总结及对比,分析不同映射方法对映射质量的影响,以期对未来不同受控词表之间实现高质量的互操作提供参考。[方法/过程]文章采用归纳总结与对比分析的方法,对映射方法进行总结并分析其对受控词表映射质量的影响。[结果/结论]映射方法包括词表连接模型及概念映射方法,不同的词表连接模型具有不同的映射条件、映射程度、映射工作量及映射质量,概念映射方法的映射类型、映射方向、映射数量的选择也会影响映射质量。[局限]未将分析结果应用于映射实践。

    2022-06-29 16:14:02

    10.12383/202206280026V1

    国家预印本平台_logo国家预印本平台

  • 23.信息类、导航类与事务类查询的网络动态性分析

    作者:张晓娟

    摘要: [目的]分析信息类、导航类与事务类查询随时间的网络动态性特征,以期为搜索引擎性能优化提供相关依据。 [过程]首先利用相关评测指标分别从查询动态﹑文档内容动态和信息需求动态三角度出发,分析了不同意图类别查询随时间变化所呈现的特征。然后,针对不同意图类别查询,分析了在不同查询流行度特征中,其文档内容以及信息需求变化情况。 [结果]信息类查询中查询流行度分布更有可能包含波峰,事务类查询中查询流行度分布更可能包含多个波峰且更具有周期性,导航类查询中查询流行度更有可能保持直线趋势;信息类查询随时间的网页内容与信息需求变化幅度均分别比其它两类查询的要大:当包含查询流行度分布中包含相同波峰数时,信息类查询的信息需求与网页内容变化幅度均分别比其它两类查询的要大;当查询流行度中整体趋势一致时,信息类查询的信息需求变化幅度相对其它两类查询要大,导航类查询的网页内容变化幅度相对其它两类查询要小。 [结论]对于信息类查询来说,搜索引擎尽可能地对其查询结果进行多样化;对于导航类查询来说,搜索引擎需要保证与之相关权威网页在查询结果中的靠前性;对于与用户交互行为相关的事务类查询,应长时间保持相关网页排序不变;对于一些与娱乐相关事务类查询,在网页排序中需考虑网页的新颖性。 [局限]观察时间段只有一个月;未对不包含波峰与包含多个波峰的查询流行度分布图中波峰进行归类与自动识别。

    2022-06-29 16:13:57

    10.12383/202206270052V1

    国家预印本平台_logo国家预印本平台

  • 24.国外iSchools院校研究生人机交互类课程特点分析

    作者:赵洁

    摘要: 人机交互是当今信息管理类专业的新兴方向之一,该方向的兴起基于人与网络、计算机及各类移动终端的互动愈加频繁。以国外iSchools院校研究生课程为例,采用网络调研与归纳总结的方法,调查各个院校人机交互课程的开设情况及课程特点,以了解当前人机交互课程开设现状及教学侧重点,为我国类似课程的设置提供借鉴。

    2022-06-29 16:13:44

    10.12383/202206280012V1

    国家预印本平台_logo国家预印本平台

  • 25.DDC关联数据的实现研究

    作者:贾君枝;赵洁

    摘要: 分类法作为规范的知识组织工具,实现其关联数据化,对书目数据的开放和网络知识组织体系的构建具有重要意义。杜威十进分类法是图书情报领域使用最为广泛的分类法,现已将其类目以关联数据的形式发布。本文基于Dewey.info平台,以DDC关联数据为例,通过对DDC关联数据发展脉络的梳理,技术构成的分析,从授权模型确定、实体对象的明确、URI命名、SKOS模型化、RDF表示五个方面,解析DDC关联数据的具体实现。以此为我国《中图法》及其他分类法的关联数据化提供一定的参考。图1。表2。参考文献13。

    2022-06-29 16:13:40

    10.12383/202206280002V1

    国家预印本平台_logo国家预印本平台

  • 26.国外iSchools院校图书情报与档案管理研究生课程调研与特征分析

    作者:司莉;赵洁;陆伟;陈玄凝;李璐

    摘要: 本文选取国外iSchools联盟中的40所院校作为调查对象,依调研指标,对调查对象院校图书情报与档案管理研究生(包括博士、硕士)开设课程进行网络调研,并对调研结果从总体课程分布与课程体系结构设置两个角度进行统计分析,围绕课程数量、课程体系完备程度、课程设置侧重点、新兴课程类别四个方面,探讨国外iSchools院校的图书情报与档案管理学科设置特点,以对我国该学科研究生课程建设提供参考。

    2022-06-29 16:13:35

    10.12383/202206280006V1

    国家预印本平台_logo国家预印本平台

  • 27.查询意图自动分类的新方法探讨

    作者:贺国秀;张晓娟

    摘要: [目的]基于Sogou查询日志数据实现查询意图的自动识别。[方法](1)将ODP主题类目体系映射到Rose等的意图类目体系,利用启发式和本体匹配的方法形成标注规则,对查询进行自动标注;(2)利用LTP工具提取查询的自然语言层面特征,包括:分词特征、词性特征和词之间的句法依赖关系特征,同时也提取出了查询的统计和用户行为特征;(3)基于所标注的查询日志数据集以及所提取的特征,利用GBDT实现查询意图的自动识别。[结果](1)本文提出的自动标注规则所标注的数据集和人工标注的数据集的标签比例接近;(2)使用本文提出的特征集合训练的分类器的意图识别效率优于不使用词之间的句法依赖关系特征的效率;(3)利用GBDT分类模型取得结果的正确率、准确率、召回率和F1值分别为0.75、0.76、0.93与0.84。[局限]本文仅使用Sogou查询日志数据,还需要在数据集上进行进一步验证;利用自然语言处理工具无法完全提取查询的语法和语义特征。[结论]本文提出的标注规则可以迅速获得大量被标注的训练数据集;充分提取自然语言层面特征可以提高查询意图的识别效果;GBDT作为集合类型的机器学习模型在意图识别效率方面优于线性分类模型(如逻辑回归和支持向量机)。

    2022-06-29 16:13:28

    10.12383/202206270053V1

    国家预印本平台_logo国家预印本平台

  • 28.国内外生物医学领域本体研究与实践进展

    作者:赵洁;司莉

    摘要: 笔者通过文献调查法归纳总结了近十年(2010—2019年)国内外生物医学领域本体文献,简要介绍了国内外重要生物医学领域本体,从构建、整合、扩展三个方面归纳总结了生物医学领域本体的相关研究,以及其在医学信息描述、查询扩展、知识库构建、术语相似度计算等方面的相关实践,并对未来发展趋势进行了展望,以期为我国生物医学领域本体的构建与应用提供借鉴。

    2022-06-29 16:13:22

    10.12383/202206280011V1

    国家预印本平台_logo国家预印本平台

  • 29.时态信息检索研究综述

    作者:张晓娟;韩毅

    摘要: [目的] 总结国内外时态信息检索研究现状,以期为相关学者更好地把握时态信息检索研究问题提供理论基础。 [文献范围]在时态信息检索领域中,关于时态信息抽取、查询中时态信息识别以及时态感知排序等方面的主要研究成果以及相关中英文文献。 [方法]基于文献调研与归纳总结方法,分别从文档中时段信息抽取、查询间段信息识别和时间感知排序三方面对时态信息检索的相关研究进行了综述与评述。 [结果] 了解了当前时态信息检索研究的最新进展与研究不足。 [局限] 未对该领域的文档采集、文档索引以及相关应用进行文献综述。 [结论] 研究发现时态信息检索研究存在着如下问题和挑战:国外对时态检索研究比较多,而国内的相关研究甚少;利用表征时间信息的实体与事件演化信息来识别文档关注时间的相关研究不足; 缺乏对非周期变化查询的意图预测; 时间态信息检索模型实验的可重复性有待提高。

    2022-06-29 16:13:15

    10.12383/202206270054V1

    国家预印本平台_logo国家预印本平台

  • 30.美国开放政府数据元数据标准及启示

    作者:司莉;赵洁

    摘要: [目的/意义]以美国开放政府数据网站Data.gov中的元数据标准为例,分析其元数据体系及具体标准,以期为我国开放政府数据元数据标准的构建提供参考。[方法/过程]采用实例分析的方法,归纳总结美国开放政府数据元数据标准的体系结构。[结果/结论]美国开放政府数据元数据标准分为数据集内容与数据集格式描述元数据标准,并针对原始数据集与地理空间数据集采用不同标准描述;并指出我国在构建自身开放政府数据元数据标准时可借鉴Data.gov中的元数据标准体系。

    2022-06-29 16:12:43

    10.12383/202206280029V1

    国家预印本平台_logo国家预印本平台

  • 31.视神经再生的研究进展

    作者: 潘统鹤;黄亚特;南开辉

    摘要: 视神经属于中枢神经的一部分,损伤后难以再生。视神经损伤通常伴随视网膜神经节细胞(retinal ganglion cells,RGCs)的持续性凋亡及视神经变性坏死,引起视力损害甚至完全失明。目前针对视神经再生的基础研究主要集中于保护和维持视神经损伤后RGCs的存活、促进RGCs轴突再生及重建视神经功能。本文以RGCs保护、轴突再生及视神经功能重建等为关键词,查询国内外最新视神经再生研究类文献,并分析整理,从抗氧化应激、提供外源性细胞因子、炎症刺激、抗胶质瘢痕、基因调控等方面阐述近年的视神经再生研究进展,以期对后续的基础研究开展及临床转化有所帮助。

    2022-06-29 09:47:52

    10.12383/202206290001V1

    国家预印本平台_logo国家预印本平台

  • 32.基于相对频次的标签相关性判断优化研究

    作者:林鑫;石宇;周知

    摘要: [目的/意义]标签相关性判断是开展标签应用研究与实践的基础。为解决这一问题,笔者此前提出了一种基于活跃度指数多次迭代的判断策略,但策略的召回率不够理想。[方法/过程]为提升策略的召回率,本文以标签与认知的基本关系为基础,提出了一种基于相对频次的改进策略,并以社会化标注社区“豆瓣电影”的675351位用户的标签数据为例进行实验,以验证策略的效果。[结果/结论]结果显示,该策略使得标签相关性判断的效果得到了显著改善。其中,对于频次不小于5的标签,策略的召回率大幅提升,由79.63%升至89.36%;准确率虽有略微下滑,由93.33%降至92.02%,但仍保持在较高水平。

    2022-06-28 14:28:34

    10.12383/202206270032V1

    国家预印本平台_logo国家预印本平台

  • 33.基于用户决策机理的个性化推荐

    作者:林鑫;桑运鑫;龙存钰

    摘要: [目的/意义] 针对基于内容的个性化推荐策略,提出资源特征选择与权值计算优化策略,从而改善个性化推荐的效果。[方法/过程] 构建了基于用户决策机理的个性化推荐模型,模型以用户决策机理为背景知识进行资源特征的选择、用户兴趣模型的构建与语义表示、用户决策函数构建。为验证模型效果,以4748位用户的观影数据为例进行了实验,实验以向量空间模型为参照模型,P@N为评价指标。[结果/结论] 实验结果显示,在N取值5,10,20,50,100,200的情况下,基于用户决策机理的个性化推荐模型效果都显著优于向量空间模型,从而验证了模型的有效性。

    2022-06-28 14:28:27

    10.12383/202206270033V1

    国家预印本平台_logo国家预印本平台

  • 34.面向高校智慧图书馆的统一用户管理系统构建研究

    作者:林鑫;宋吉

    摘要: 为推进高校智慧图书馆平台及子系统服务的个性化与数据驱动的智慧管理,需要升级用户管理系统。本文在分析高校图书馆用户管理系统建设现状、存在问题基础上,提出了用户管理系统升级目标;进而构建了面向高校智慧图书馆的统一用户管理系统模型,包括账号数据管理、权限管理、身份认证、安全管理、消息管理与数据中台模块;最后,提出了基于跨系统跨组织协同的推进策略,以保障统一用户管理系统的功能目标得以实现,并能够在用户服务、图书馆管理中发挥应有价值。

    2022-06-28 14:28:08

    10.12383/202206270037V1

    国家预印本平台_logo国家预印本平台

  • 35.社会化标注环境下基于活跃度指数的图书特色挖掘研究

    作者:林鑫;石宇

    摘要: 对图书特色进行挖掘和展示,有利于减轻图书数量的爆炸性增长为读者选书带来的困扰。随着Web2.0 的发展,产生了一批规模较大的社会化图书标注系统,并积累了大量的标签,这为图书特色全面挖掘带来了契机。以社会化标签为基础数据源,本文提出了基于活跃度指数的图书特色挖掘模型,并以国外知名图书社会化标注系统LibraryThing中1206本科幻小说的标签数据为例进行了原型实现。从原型系统效果看,96.77%的图书能够基于该策略挖掘出至少一个特色标签,平均为6.5个;通过与SF Signal网站的专家总结的图书特色相比,该策略能够覆盖专家分析特色的77.2%,且绝大部分非重合标签也反映了图书的特色,因此该策略能够较好地实现图书特色挖掘。

    2022-06-28 14:28:00

    10.12383/202206270038V1

    国家预印本平台_logo国家预印本平台

  • 36.用户认知对标签使用行为的影响分析——基于电影社会化标注数据的实证分析

    作者:林鑫;周知

    摘要: 在标签使用行为影响因素的研究中,往往忽略了用户认知这一因素。为分析用户认知对标签使用行为的影响,本文从资源特征认知难度和用户认知风格两个方面展开分析,基于认知心理学的研究成果提出相应假设,并将其转化为可以量化分析的标签统计特征,以更直接、客观地加以检验。在此基础上,基于Movielens社区中81部影片的高频标签和675351豆瓣电影社区用户的标签数据对假设进行了检验。结果表明,用户认知对其标签使用行为具有显著影响,其中资源特征认知难度的增加会显著降低该特征被标注的可能性,而用户认知风格则会导致其在标注上具有明显的个人倾向。该结论对社会化标签的应用研究和社会化标注系统的设计均具有启发意义。

    2022-06-28 14:27:51

    10.12383/202206270041V1

    国家预印本平台_logo国家预印本平台

  • 37.用户社会化标注中非理性行为的表现及原因分析

    作者:林鑫;梁宇

    摘要: 本文对用户社会化标注非理性行为的表现和原因进行了研究。在研究中综合运用了日志分析法和深度访谈法,样本包括287位豆瓣电影用户的社会化标注数据以及15位豆瓣电影用户的访谈数据。结果表明,在用户的社会化标注中确实普遍存在非理性标注的问题,主要表现在标注对象选择、标注角度和标签表达三个方面;其原因与用户态度的随意性、标注动机、标注习惯以及社会化标注系统有关。这些结论对社会化标签的应用研究与实践具有指导意义。

    2022-06-28 14:27:35

    10.12383/202206270042V1

    国家预印本平台_logo国家预印本平台

  • 38.资源发现系统中基于多源数据融合的文献元数据质量提升

    作者:林鑫;李想;李静

    摘要: [目的/意义]构建面向多源文献元数据的数据融合模型,以提升发现系统中元数据的质量,进而为用户体验良好的文献发现服务组织奠定数据基础。[方法/过程]首先分析文献元数据存在的代表性质量问题及成因,在此基础上构建多源文献元数据融合模型,包括元数据著录规则及质量分析、数据预处理、基于多元数据项的数据判重、元数据内容融合策略体系,最后通过实验验证模型效果。[结果/结论]实验表明,模型在元数据判重环节的准确率和召回率分别达到99.9%和99.2%,均高于对照组;完成元数据内容融合后,题名、作者、摘要、页码等元数据项的质量均有明显提升。

    2022-06-28 14:27:27

    10.12383/202206270044V1

    国家预印本平台_logo国家预印本平台

  • 39.科技文献副主题词抽取及其在分面检索中的应用

    作者:胡昌平;林鑫;陈果

    摘要: 在进行文献检索时,用户一般仅关注某一主题的某个或某些方面,而副主题词反映了一篇文献主要研究了其主题的哪个方面,因而对科技文献检索具有重要意义。但在以往的中文科技文献标引时,一直都忽视了副主题词的标引。为实现副主题词的自动标引,本文提出了以标题作为抽取数据源、基于规则进行抽取的实现方法,并以图情领域文献进行了实验。结果显示,基于规则的抽取方法在召回率和准确率方面表现良好,均超过了90%;但仅以标题作为抽取数据源会导致召回率偏低,仅有49.9%的文献能抽取出副主题词。最后,本文以图情领域文献为例构建了分面检索原型系统,并将副主题词作为检索入口和分面应用于其中,从效果来,副主题词作为独立的检索点价值不大,但和其他检索点配合使用则可以更贴切地表达用户需求,作为分面则能在帮助用户进行探索式检索以及结果筛选方面发挥重要作用。

    2022-06-28 14:20:01

    10.12383/202206270034V1

    国家预印本平台_logo国家预印本平台

  • 40.社会化标注系统中基于标签和项目的兴趣建模比较研究

    作者:胡潜;林鑫

    摘要: 近年来,基于标签构建用户兴趣模型受到了重点关注,然而也有研究对其有效性提出了质疑。为验证标签是否适合作为兴趣建模的基础数据、效果是否更加理想,本文以电影社会化标注系统为例,采用空间向量的方法分别基于标签和项目进行了兴趣建模,并以用户召回率、推荐项目召回率和准确率为评价指标进行了效果比较分析。结果显示,基于标签建模策略效果显著差于基于项目建模策略;但是在用户标注影片较多的情况下,基于标签建模策略也取得较好效果。研究的局限性主要表现在两个方面:一是分析对象选用的是影片,其结果未必适用于音乐、图书、网页等类型的资源;二是研究仅针对影片类型兴趣进行了建模,没有建立综合模型,因而其结果可能未全面反映基于标签和项目建模策略的效果。

    2022-06-28 10:35:04

    10.12383/202206270039V1

    国家预印本平台_logo国家预印本平台