|国家预印本平台
首页 > 星级预印本
  • 1.国内外生物医学领域本体研究与实践进展

    作者:赵洁;司莉

    摘要: 笔者通过文献调查法归纳总结了近十年(2010—2019年)国内外生物医学领域本体文献,简要介绍了国内外重要生物医学领域本体,从构建、整合、扩展三个方面归纳总结了生物医学领域本体的相关研究,以及其在医学信息描述、查询扩展、知识库构建、术语相似度计算等方面的相关实践,并对未来发展趋势进行了展望,以期为我国生物医学领域本体的构建与应用提供借鉴。

    2022-06-29 16:13:22

    10.12383/202206280011V1

    国家预印本平台_logo国家预印本平台

  • 2.时态信息检索研究综述

    作者:张晓娟;韩毅

    摘要: [目的] 总结国内外时态信息检索研究现状,以期为相关学者更好地把握时态信息检索研究问题提供理论基础。 [文献范围]在时态信息检索领域中,关于时态信息抽取、查询中时态信息识别以及时态感知排序等方面的主要研究成果以及相关中英文文献。 [方法]基于文献调研与归纳总结方法,分别从文档中时段信息抽取、查询间段信息识别和时间感知排序三方面对时态信息检索的相关研究进行了综述与评述。 [结果] 了解了当前时态信息检索研究的最新进展与研究不足。 [局限] 未对该领域的文档采集、文档索引以及相关应用进行文献综述。 [结论] 研究发现时态信息检索研究存在着如下问题和挑战:国外对时态检索研究比较多,而国内的相关研究甚少;利用表征时间信息的实体与事件演化信息来识别文档关注时间的相关研究不足; 缺乏对非周期变化查询的意图预测; 时间态信息检索模型实验的可重复性有待提高。

    2022-06-29 16:13:15

    10.12383/202206270054V1

    国家预印本平台_logo国家预印本平台

  • 3.社会化标注环境下基于活跃度指数的图书特色挖掘研究

    作者:林鑫;石宇

    摘要: 对图书特色进行挖掘和展示,有利于减轻图书数量的爆炸性增长为读者选书带来的困扰。随着Web2.0 的发展,产生了一批规模较大的社会化图书标注系统,并积累了大量的标签,这为图书特色全面挖掘带来了契机。以社会化标签为基础数据源,本文提出了基于活跃度指数的图书特色挖掘模型,并以国外知名图书社会化标注系统LibraryThing中1206本科幻小说的标签数据为例进行了原型实现。从原型系统效果看,96.77%的图书能够基于该策略挖掘出至少一个特色标签,平均为6.5个;通过与SF Signal网站的专家总结的图书特色相比,该策略能够覆盖专家分析特色的77.2%,且绝大部分非重合标签也反映了图书的特色,因此该策略能够较好地实现图书特色挖掘。

    2022-06-28 14:28:00

    10.12383/202206270038V1

    国家预印本平台_logo国家预印本平台

  • 4.用户认知对标签使用行为的影响分析——基于电影社会化标注数据的实证分析

    作者:林鑫;周知

    摘要: 在标签使用行为影响因素的研究中,往往忽略了用户认知这一因素。为分析用户认知对标签使用行为的影响,本文从资源特征认知难度和用户认知风格两个方面展开分析,基于认知心理学的研究成果提出相应假设,并将其转化为可以量化分析的标签统计特征,以更直接、客观地加以检验。在此基础上,基于Movielens社区中81部影片的高频标签和675351豆瓣电影社区用户的标签数据对假设进行了检验。结果表明,用户认知对其标签使用行为具有显著影响,其中资源特征认知难度的增加会显著降低该特征被标注的可能性,而用户认知风格则会导致其在标注上具有明显的个人倾向。该结论对社会化标签的应用研究和社会化标注系统的设计均具有启发意义。

    2022-06-28 14:27:51

    10.12383/202206270041V1

    国家预印本平台_logo国家预印本平台

  • 5.基于用户决策机理的个性化推荐

    作者:林鑫;桑运鑫;龙存钰

    摘要: [目的/意义] 针对基于内容的个性化推荐策略,提出资源特征选择与权值计算优化策略,从而改善个性化推荐的效果。[方法/过程] 构建了基于用户决策机理的个性化推荐模型,模型以用户决策机理为背景知识进行资源特征的选择、用户兴趣模型的构建与语义表示、用户决策函数构建。为验证模型效果,以4748位用户的观影数据为例进行了实验,实验以向量空间模型为参照模型,P@N为评价指标。[结果/结论] 实验结果显示,在N取值5,10,20,50,100,200的情况下,基于用户决策机理的个性化推荐模型效果都显著优于向量空间模型,从而验证了模型的有效性。

    2022-06-28 14:28:27

    10.12383/202206270033V1

    国家预印本平台_logo国家预印本平台

  • 6.美国开放政府数据元数据标准及启示

    作者:司莉;赵洁

    摘要: [目的/意义]以美国开放政府数据网站Data.gov中的元数据标准为例,分析其元数据体系及具体标准,以期为我国开放政府数据元数据标准的构建提供参考。[方法/过程]采用实例分析的方法,归纳总结美国开放政府数据元数据标准的体系结构。[结果/结论]美国开放政府数据元数据标准分为数据集内容与数据集格式描述元数据标准,并针对原始数据集与地理空间数据集采用不同标准描述;并指出我国在构建自身开放政府数据元数据标准时可借鉴Data.gov中的元数据标准体系。

    2022-06-29 16:12:43

    10.12383/202206280029V1

    国家预印本平台_logo国家预印本平台

  • 7.基于活跃性指数的标签相关性判断研究*

    作者:林鑫;周知

    摘要: [目的/意义]改善标签相关性判断策略效果不理想、通用性较差的问题。[方法/过程]结合标签相关性判断的特点对活跃性指数的计算方法进行改造,进而提出了一种基于多次活跃性指数迭代的标签相关性判断策略,并以社会化标注社区“豆瓣电影”的675351位用户的标签数据为例进行实验,以验证策略的效果。[结果/结论]实验结果显示,该策略的召回率为79.6%,准确率为93.3%,均较为理想,明显优于常用的Top-N策略。同时,该策略的通用性较好,适用于视频、音频、文本等各类型媒体。因此,该策略能够较好地解决标签的相关性判断问题。

    2022-06-28 10:34:50

    10.12383/202206270031V1

    国家预印本平台_logo国家预印本平台

  • 8.非虚构流媒体短片的发展与革新

    作者:毕翔;唐存琛

    摘要: 非虚构流媒体短片是近两年来被业界热议的话题。它的存在形式既饱受争议也备受关注。其选取题材的广泛性、不拘泥于单一介质的传播性、创作手法的个性化也使受众对主题价值的判断和审美观念做出了重新的布局和思考。本文将从非虚构流媒体短片的定义展开,结合当下备受关注的制作模式,以非虚构流媒体短片为主线“上溯根源”、“下探革新”。

    2022-06-28 09:46:36

    10.12383/202206270003V1

    国家预印本平台_logo国家预印本平台

  • 9.资源发现系统中基于多源数据融合的文献元数据质量提升

    作者:林鑫;李想;李静

    摘要: [目的/意义]构建面向多源文献元数据的数据融合模型,以提升发现系统中元数据的质量,进而为用户体验良好的文献发现服务组织奠定数据基础。[方法/过程]首先分析文献元数据存在的代表性质量问题及成因,在此基础上构建多源文献元数据融合模型,包括元数据著录规则及质量分析、数据预处理、基于多元数据项的数据判重、元数据内容融合策略体系,最后通过实验验证模型效果。[结果/结论]实验表明,模型在元数据判重环节的准确率和召回率分别达到99.9%和99.2%,均高于对照组;完成元数据内容融合后,题名、作者、摘要、页码等元数据项的质量均有明显提升。

    2022-06-28 14:27:27

    10.12383/202206270044V1

    国家预印本平台_logo国家预印本平台

  • 10.用户社会化标注中非理性行为的表现及原因分析

    作者:林鑫;梁宇

    摘要: 本文对用户社会化标注非理性行为的表现和原因进行了研究。在研究中综合运用了日志分析法和深度访谈法,样本包括287位豆瓣电影用户的社会化标注数据以及15位豆瓣电影用户的访谈数据。结果表明,在用户的社会化标注中确实普遍存在非理性标注的问题,主要表现在标注对象选择、标注角度和标签表达三个方面;其原因与用户态度的随意性、标注动机、标注习惯以及社会化标注系统有关。这些结论对社会化标签的应用研究与实践具有指导意义。

    2022-06-28 14:27:35

    10.12383/202206270042V1

    国家预印本平台_logo国家预印本平台

  • 11.面向高校智慧图书馆的统一用户管理系统构建研究

    作者:林鑫;宋吉

    摘要: 为推进高校智慧图书馆平台及子系统服务的个性化与数据驱动的智慧管理,需要升级用户管理系统。本文在分析高校图书馆用户管理系统建设现状、存在问题基础上,提出了用户管理系统升级目标;进而构建了面向高校智慧图书馆的统一用户管理系统模型,包括账号数据管理、权限管理、身份认证、安全管理、消息管理与数据中台模块;最后,提出了基于跨系统跨组织协同的推进策略,以保障统一用户管理系统的功能目标得以实现,并能够在用户服务、图书馆管理中发挥应有价值。

    2022-06-28 14:28:08

    10.12383/202206270037V1

    国家预印本平台_logo国家预印本平台

  • 12.科技文献检索中基于主题词表分面化改造的分面构建

    作者:胡昌平;林鑫

    摘要: 分面检索已经在科技文献检索中得到了广泛应用,但由于缺乏粒度较细、结构清晰内容分面体系,导致内容角度的分面设置一直不理想,严重影响了使用体验。面向这一问题,本文提出了基于主题词表分面化改造来构建科技文献内容分面的思路,并以教育学科为例进行了原型系统实现。从原型系统效果看,基于该方法可以将检索结果所涵盖的主题和分布进行较为清晰的展现,便于用户便捷地进行文献探索和筛选。图6。表3。参考文献28。

    2022-06-28 14:28:14

    10.12383/202206270036V1

    国家预印本平台_logo国家预印本平台

  • 13.基于相对频次的标签相关性判断优化研究

    作者:林鑫;石宇;周知

    摘要: [目的/意义]标签相关性判断是开展标签应用研究与实践的基础。为解决这一问题,笔者此前提出了一种基于活跃度指数多次迭代的判断策略,但策略的召回率不够理想。[方法/过程]为提升策略的召回率,本文以标签与认知的基本关系为基础,提出了一种基于相对频次的改进策略,并以社会化标注社区“豆瓣电影”的675351位用户的标签数据为例进行实验,以验证策略的效果。[结果/结论]结果显示,该策略使得标签相关性判断的效果得到了显著改善。其中,对于频次不小于5的标签,策略的召回率大幅提升,由79.63%升至89.36%;准确率虽有略微下滑,由93.33%降至92.02%,但仍保持在较高水平。

    2022-06-28 14:28:34

    10.12383/202206270032V1

    国家预印本平台_logo国家预印本平台

  • 14.视神经再生的研究进展

    作者: 潘统鹤;黄亚特;南开辉

    摘要: 视神经属于中枢神经的一部分,损伤后难以再生。视神经损伤通常伴随视网膜神经节细胞(retinal ganglion cells,RGCs)的持续性凋亡及视神经变性坏死,引起视力损害甚至完全失明。目前针对视神经再生的基础研究主要集中于保护和维持视神经损伤后RGCs的存活、促进RGCs轴突再生及重建视神经功能。本文以RGCs保护、轴突再生及视神经功能重建等为关键词,查询国内外最新视神经再生研究类文献,并分析整理,从抗氧化应激、提供外源性细胞因子、炎症刺激、抗胶质瘢痕、基因调控等方面阐述近年的视神经再生研究进展,以期对后续的基础研究开展及临床转化有所帮助。

    2022-06-29 09:47:52

    10.12383/202206290001V1

    国家预印本平台_logo国家预印本平台

  • 15.美国超重-星舰首飞分析及对中国航天产业发展启示与建议

    作者:孟光;刘昶;杨冬春;周城宏;周华

    摘要: 重复使用运载器研制是航天发展的不懈追求,美国太空探索技术公司两级完全重复使用运载器“超重-星舰”实现首次发射,发射阶段圆满,后续飞行失控后执行自毁程序。本文介绍了超重-星舰的首飞情况与方案演进,根据超重-星舰总体方案反演分析其应用模式,梳理了超重-星舰的核心关键技术,总结了超重-星舰对航天产业的影响,最后给出了超重-星舰对中国航天发展的启示与建议。

    2023-04-21 17:13:35

    10.12383/202304210004V1

    国家预印本平台_logo国家预印本平台

  • 16.用户信息资源认知图式:影响因素、分析方法与应用价值

    作者:林鑫;龙存钰;杜莹

    摘要: [目的/意义] 从认知心理学与认知科学的研究成果看,认知图式在个体认知与决策活动中发挥着基础性的框架作用,因此对用户信息资源认知图式进行研究,有助于深入理解用户信息行为,为信息资源管理与信息素养教育优化提供参考。[方法/过程] 从认知心理学的图式概念出发,首先分析用户信息资源认知图式的内涵及主要特点,进而分析其影响因素,提出数据驱动的分析方法,并探讨其在信息资源组织与服务、信息素养教育中的应用价值。[结果/结论]用户信息资源认知图式受资源、用户自身和系统三类因素的影响;大数据环境下,应采用UGC数据和行为日志数据驱动的用户信息资源认知图式分析方法,以实现用户群体、个体认知图式的高效率、定量化分析;在应用方面,既可以基于用户信息资源认知图式深化信息行为机理与规律研究,也可以指导用户认知视角下的元数据体系构建和精准化、智能化服务组织,还可以用于推进信息素养教育研究与实践的深化。

    2022-06-28 09:45:54

    10.12383/202206270043V1

    国家预印本平台_logo国家预印本平台

  • 17.文献资源发现系统分面检索功能比较研究

    作者:林鑫;吴茜

    摘要: 分面检索是文献资源发现系统的重要服务,其功能设计是影响用户体验的关键因素。为了解文献资源发现系统分面检索功能设计现状、存在的主要问题,选取了选取八个代表性发现系统为对象,从分面体系框架及焦点设置、分面及焦点排序策略、分面体系展现策略和交互机制四个方面进行调研与比较分析。结果显示,各系统的分面检索功能设计区别显著,存在一些共性问题亟待解决。建议推进分面体系的规范化、系统化与语义化,采用动静结合策略优化分面及焦点排序效果,实施分面体系展现的智能化动态控制,提升分面交互的灵活性与可理解性。

    2022-06-28 09:46:14

    10.12383/202206270040V1

    国家预印本平台_logo国家预印本平台

  • 18.科技文献检索中基于主题词表分面化改造的分面构建

    作者:胡昌平;林鑫

    摘要: 分面检索已经在科技文献检索中得到了广泛应用,但由于缺乏粒度较细、结构清晰内容分面体系,导致内容角度的分面设置一直不理想,严重影响了使用体验。面向这一问题,本文提出了基于主题词表分面化改造来构建科技文献内容分面的思路,并以教育学科为例进行了原型系统实现。从原型系统效果看,基于该方法可以将检索结果所涵盖的主题和分布进行较为清晰的展现,便于用户便捷地进行文献探索和筛选。图6。表3。参考文献28。

    2022-06-28 09:46:20

    10.12383/202206270035V1

    国家预印本平台_logo国家预印本平台

  • 19.社会化标注系统中基于标签和项目的兴趣建模比较研究

    作者:胡潜;林鑫

    摘要: 近年来,基于标签构建用户兴趣模型受到了重点关注,然而也有研究对其有效性提出了质疑。为验证标签是否适合作为兴趣建模的基础数据、效果是否更加理想,本文以电影社会化标注系统为例,采用空间向量的方法分别基于标签和项目进行了兴趣建模,并以用户召回率、推荐项目召回率和准确率为评价指标进行了效果比较分析。结果显示,基于标签建模策略效果显著差于基于项目建模策略;但是在用户标注影片较多的情况下,基于标签建模策略也取得较好效果。研究的局限性主要表现在两个方面:一是分析对象选用的是影片,其结果未必适用于音乐、图书、网页等类型的资源;二是研究仅针对影片类型兴趣进行了建模,没有建立综合模型,因而其结果可能未全面反映基于标签和项目建模策略的效果。

    2022-06-28 10:35:04

    10.12383/202206270039V1

    国家预印本平台_logo国家预印本平台

  • 20.查询意图自动分类的新方法探讨

    作者:贺国秀;张晓娟

    摘要: [目的]基于Sogou查询日志数据实现查询意图的自动识别。[方法](1)将ODP主题类目体系映射到Rose等的意图类目体系,利用启发式和本体匹配的方法形成标注规则,对查询进行自动标注;(2)利用LTP工具提取查询的自然语言层面特征,包括:分词特征、词性特征和词之间的句法依赖关系特征,同时也提取出了查询的统计和用户行为特征;(3)基于所标注的查询日志数据集以及所提取的特征,利用GBDT实现查询意图的自动识别。[结果](1)本文提出的自动标注规则所标注的数据集和人工标注的数据集的标签比例接近;(2)使用本文提出的特征集合训练的分类器的意图识别效率优于不使用词之间的句法依赖关系特征的效率;(3)利用GBDT分类模型取得结果的正确率、准确率、召回率和F1值分别为0.75、0.76、0.93与0.84。[局限]本文仅使用Sogou查询日志数据,还需要在数据集上进行进一步验证;利用自然语言处理工具无法完全提取查询的语法和语义特征。[结论]本文提出的标注规则可以迅速获得大量被标注的训练数据集;充分提取自然语言层面特征可以提高查询意图的识别效果;GBDT作为集合类型的机器学习模型在意图识别效率方面优于线性分类模型(如逻辑回归和支持向量机)。

    2022-06-29 16:13:28

    10.12383/202206270053V1

    国家预印本平台_logo国家预印本平台