您正在访问亚汇网香港分站,本站所提供的内容均遵守中华人民共和国香港特别行政区法律法规。

苹果研究破解 AI“英语口音”难题,提升多语言自然性

文 / 小亚 2025-05-17 07:02:06 来源:亚汇网

研究人员针对非英语语种输出中普遍存在的语法与词汇偏差问题展开了深度剖析,测试覆盖中文、法语、英语(基于维基百科)语料。测试发现,即使专为中文优化的Qwen模型,其母语表现仍落后人类水平;Meta的Llama3.1综合表现最佳,但自然度仍存在显著差距;所有模型在非英语输出中均残留英语语法结构。换句话说,即使模型在用中文或法语进行对话,但它仍在用英语进行“思考”,而且非英语输出仍然遵循类似英语的语法和词汇模式。针对大语言模型的遣词造句,研究团队提出两项量化指标:词汇自然性(LexicalNaturalness):评估LLM用词是否符合母语习惯句法自然性(SyntacticNaturalness):检验LLM语句是否贴合本土语法为了缩小差距,研究人员通过“回译法”自动生成训练样本,将人工撰写的流畅中文内容先翻译成英文,再逆向翻译成带有"翻译腔"的“反面”样本。利用这类对比数据训练模型加强自然表达能力,在保持基准性能的前提下显著改善语言输出质量。论文地址:https://arxiv.org/abs/2410.15956广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,亚汇网所有文章均包含本声明。

相关新闻

加载更多...

排行榜 日排行 | 周排行