国家预印本平台
中国首发,全球知晓
唇动到语音合成的目标是根据无声说话人视频,合成与视频同步的高质量语音。然而,由于预测目标的复杂性及对先验知识的提取和利用不充分,先前大量工作所生成的语音听感机器化且准确度不高。为了解决这个问题,本文提出一种新的唇动到语音合成框架FusionV2S。首先设计音频掩码自编码器,采用不规则掩码重建的方式学习上下文语义信息,获取增强音频特征。然后设计音频自监督迭代聚类方法,细化该特征的聚类分配,得到量化的自监督语音单元,为合成语音提供有效补充。同时设计去噪扩散模型,该模型结合卷积、多头注意力以及前馈神经网络聚焦带噪梅尔频谱的时序信息,从而在解码梅尔频谱时降低预测目标的复杂性。进一步地,以提取的唇部视频特征为条件,建立语音单元和梅尔频谱两个指导目标,充分利用该条件进行解码。最后,将两者融合用于指导音频的生成,很好地弥补了两个指导目标各自存在的缺陷。本文方法在公开的中文无约束多说话人数据集CMLR、CN-CVS上取得了先进的性能。
随着移动互联网、云计算、物联网的迅猛发展,信息化、数字化的生活方式促使光通信网络规模不断扩展,全球光纤传送网的数据承载能力不断提高,进一步提升光通信网络的通信容量已经成为未来光纤通信发展的必然趋势。目前光通信系统可以使用正交频分复用、密集波分复用、时分复用、空分复用、高阶调制等技术来提升通信容量。本文从时间压缩原理出发,提出了一种新型的压缩光通信系统。该系统在发射端把多个电信号调制到光脉冲上,基于全光信号处理将多路信号复用传输。在接收端采用多通道并行方式,将高速信号重新还原为低速光信号后采样处理,消除电子瓶颈问题。最后进行了概念验证实验,搭载2Gbit/s的电学信号,传输速率可以达到32Gbit/s。如果进一步提高电学信号的速率,通信速率有望进一步提升。
综述文章:以背景、研究现状、研究用途的结构书写,篇幅以150~300字左右为宜,不用第一人称做主语,不与正文语句重复。一般研究性文章:以摘录要点的形式按目的、方法、结果、结论的结构报道出作者的主要研究成果,字数在200~400字左右为宜,不用第一人称做主语,不与正文语句重复。}\abstractCHN{云计算环境中的任务调度问题是一个受到广泛研究的问题。在负载均衡任务调度中,现有的强化学习方法通常采用加权法来平衡负载均衡指标和时间指标,而预先设定的权重很难适应多变的云环境。针对上述局限性,本文在策略学习方法的基础上提出了一个约束优化问题,并提出了两阶段强化学习方法 TSRLB 作为负载均衡任务调度问题的解决方案。通过跟踪仿真,我们证明了 TSRLB 算法在平均完成时间和负载平衡这两个指标上优于传统算法和现有的强化学习方法。
ResNet模型是说话人识别领域内的主流模型,其具有优秀的局部信息获取能力,但获取全局信息欠缺。相关领域的研究表明将全局信息引入ResNet模型能够有效提高模型性能。因此,本文向ResNet模型引入多尺度特征提取和多尺度注意力融合模块,提出了基于多尺度注意力融合的说话人识别方法,通过这两个模块可以有效建模全局信息,丰富模型对于说话人身份信息的获取。其次,使用多头注意力池化代替传统统计池化,有效提升话语级特征向量对于不同说话人的区分度。最终通过仿真实验验证了本文所提方法的有效性和优越性
his study investigates the chemical freeze-out of hadrons, including light-flavor, strange-flavor particles, and light nuclei, produced in Au+Au collisions at the Relativistic Heavy Ion Collider (RHIC). Utilizing the Thermal-FIST thermodynamic statistical model, we analyzed various particle sets: those inclusive of light nuclei, those exclusive of light nuclei, and those solely comprising light nuclei. We have determined the chemical freeze-out parameters at $\sqrt{s_\text{NN}}=$7.7-200 GeV and four centralities. A significant finding was a decrease in the chemical freeze-out temperature $T_{\textrm{ch}}$ upon the inclusion of light nuclei, with an even more pronounced reduction when considering light nuclei yields exclusively. This indicates that light nuclei formation occurs at a later stage in the system’s evolution at RHIC energies. We present parameterized formulas that describe the energy dependence of the chemical freeze-out temperature $T_{\textrm{ch}}$ and baryon chemical potential $\mu_B$ for three distinct particle sets in central Au+Au collisions at RHIC energies. Our results reveal the presence of at least three distinct freeze-out hyper-surfaces at RHIC energies, corresponding to different chemical freeze-out temperatures: a light flavor freeze-out temperature of $T_L$=150.2$\pm$6 MeV, a strange flavor freeze-out temperature $T_s$=165.1$\pm$2.7 MeV, and a light nuclei freeze-out temperature $T_{\textrm{ln}}$=141.7$\pm$1.4 MeV. Notably, at the Large Hadron Collider (LHC) energies, the expected lower freeze-out temperature for light nuclei was not observed. Instead, the chemical freeze-out temperature for light nuclei was found to be approximately 10 MeV higher than that for light flavor hadrons. This discrepancy may suggest different production mechanisms for light nuclei between RHIC and LHC energies.