【信息技術】【人工智能】202508200067“絲路”多語言機器翻譯平臺(計算學部)
【成果簡介】
針對中文到斯拉夫語系翻譯過程中存在的翻譯質量不穩定、領域適應性差等問題,提出了一套基于底座預訓練語言模型、語言聚類訓練策略、多語言優化目標、模型架構等四個維度的綜合解決方案。通過分析斯拉夫語言的內在語言特性及翻譯語料的統計特征,提出了多目標自蒸餾策略,解決了多語言數據不均衡帶來的收斂不一致性問題;發明了帕累托互蒸餾訓練算法,突破了多語言帕累托優化困境;實現了基于梯度沖突的自適應參數分配策路,有效緩解多語言參數沖突問題
【技術指標】
支持32種一帶一路國家語言,在16個語言方向翻譯水平達到全國第一,平均超過第二名1.9的BLEU值,達到了約5.6%的性能提升。
【應用前凳】
該技術能夠顯苦提高中國與斯拉夫語系國家之間的溝通效率,促進政府間的政治、經濟、文化交流合作。可以推廣應用于“一帶一路”國際會議、雙邊會談及多邊協商中的實時翻譯,減少語言障礙。為學術研究擺供文獻翻譯支持,推動跨語言的學術交流與合作;促進多語言教學,助力高校提供中文和斯拉夫語系語言的雙語課程。
【聯系人及聯系方式】
喬老師,0451-86418046
馬老師,0451-85975690