大语言模型揭示语言与文化的关系
2024年03月04日 12:07 来源:《中国社会科学报》2024年3月4日第2844期 作者:刘雨微/编译

  本报综合外媒报道 有语言学家认为,不同的语言在诸如自然、颜色和亲属关系等特定的语义域可能存在实质性差异。如今,大语言模型让学者能够系统性比较不同语义域中的词汇组织,更直接地描述差异。近日,美国芝加哥大学社会学教授詹姆斯·埃文斯 (James Evans)等人在《美国国家科学院院刊》发文称,在不同语言中,相同事物的意义在特定语义域内相似,但在不同语义域之间有所不同;“手”“树”“锅”等具体意义在不同语言间的差异要小于“幸福”“真理”“民主”等抽象意义。此外,在文化层面或地理层面相距较近的语言对某些语义域的概念和术语的表达往往更相似。该研究对促进跨文化交流以及理解语言的本质具有重要意义。

  萨丕尔—沃尔夫假说,又称为语言相对论,是语言人类学探讨的核心问题之一。该假说认为,语言结构塑造着语言使用者的世界观和认知体系,指导着个体的思维方式。为了深入理解语言、思维和文化之间的关系,比较不同语言中词语的语义相似性和差异性,埃文斯等人借用机器学习技术,在大量多语言文本数据中构建了“词嵌入”模型。作为一种自然语言处理技术,“词嵌入”将文本中的单词转换为数字向量,映射到密集、连续的向量空间中,使得语义相似的词语的空间距离也相似。该模型的训练文本数据由两个大型数据源组成:一个是由35种语言撰写的维基百科文章组成的大型母语文本语料库;另一个是由38500名母语相同的人用英语撰写的托福作文。

  研究表明,越是具体的事物在不同语言中的意义越一致。在不同的语言中,某些语义域(如医疗保健)的概念、术语和表达方式相对稳定和保守,因此语言使用者在使用“医生”“护士”“疾病”等词语中的一个时,也会使用到其他词语。此外,意义会随着距离而变化;文化距离、物理空间距离、亲属关系的远近、气候差异等因素都影响着每个人在词汇之间构建意义的差异。例如,汉语普通话使用者在讨论家庭时往往会使用物理空间隐喻,例如山脉和海洋。另一种语言的使用者则习惯使用与健康和治愈有关的隐喻。

  埃文斯认为,联想、隐喻和叙述是连接事物在语言中不同意义的方式。然而,联想和隐喻的不同用法可能会引发人们对同一事物的不同理解,进而影响复杂思想的准确表达。因此,人们在语言教学、跨文化交流和翻译文本时,要更用心地去理解、处理语义差异,避免误解和错误传达。埃文斯表示,人们表达和理解故事的方式,以及对某个语义解释的接受程度,深受人们通过母语习得的认知模式的影响。埃文斯表示,当研究人员能够更精确地预测和衡量不同语言下联想和隐喻的用法时,就能进一步改善在线翻译器的质量,让隐喻和联想用法像句法和语法一样可以被教授,还可以协助撰写同时影响多种语言使用群体的法令和法律。

  (刘雨微/编译)

责任编辑:张晶
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026

Baidu
map