面向形态丰富语言的翻译规则选择方法
目前的机器翻译模型都是针对形态变化简单的语言(如英语)设计的,不太适合于形态丰富语言(如维吾尔语)。在本文中,我们通过区别对待形态丰富语言中的词干与词缀,提出了一种新型的面向形态丰富语言的翻译规则选择方法。我们用词干作为基本翻译单元以缓解数据稀疏问题,此外,每条词干粒度的翻译规则上还附着一个词缀分布。在翻译时,通过计算待翻译片段的词缀分布与翻译规则词缀分布的相似度,来选择更合适的翻译规则。从三种形态丰富语言(维吾尔语、哈萨克语、柯尔克孜语)到汉语的翻译实验表明,该方法显著改善了翻译质量。
刘群、王志洋、吕雅娟、孙萌、姜文斌
阿尔泰语系(突厥-蒙古-通古斯语系)语言学常用外国语
机器翻译形态丰富语言词缀分布相似度动态特征
刘群,王志洋,吕雅娟,孙萌,姜文斌.面向形态丰富语言的翻译规则选择方法[EB/OL].(2017-03-10)[2025-08-16].https://chinaxiv.org/abs/201703.00228.点此复制
评论