康森傑教授:漢語音韻數據庫與互文網路在比較語言學和人工智能中的應用(2026/1/28)

img-title img-title

 

饒宗頤國學院獲歐亞基金會贊助,在1月28日主辦「跨學科視域下的早期歐亞文明交匯」系列第十一場講座,由芝加哥大學人文學院技術副總監康森傑教授(Jeffrey Tharsen)主講「漢語音韻數據庫與互文網路在比較語言學和人工智能中的應用」。是次講座深入討論如何利用創新技術結合人文學科,展示了古漢語音韻與互文比對在人工智能建構中的應用,吸引逾100位師生親臨現場參與,當中大部分來自修讀浸大數位未來與人文學科文理學士的學生。

康森傑教授的講座主要圍繞四個方面展開:前現代漢語音韻學的計算研究、中文文本互文性的分析方法、周代青銅器銘文中的互文實踐,以及人工智能在學術研究的未來前景。他通過構建古漢語詞源字典(EDOC),為《詩經》等傳統經典進行音韻注釋;同時利用互文比對工具TextPAIR對二十四史及六十三種經、子、集類文獻進行系統分析,建立起中國經典的互文網絡,開拓了漢學研究的新範式。尤為突出的是,康森傑教授以周代青銅器銘文作為初始語料庫,成功解讀了如大盂鼎等銘文中的押韻結構,揭示出早期漢語的語音修辭特徵。同時,通過對二千七百餘篇周代長銘文進行分析,康森傑教授指出其內部存在約29.5萬處互文表達,並與《詩經》、《尚書》、《左傳》等傳世文獻有多處語言同源現象,為周代歷史研究提供了實證數據。

康森傑教授最後指出,當前如GPT等通用大模型在處理古典語料時,尚無法穩定檢測文本互文及復用現象。他主張應著力探索人工智能訓練框架,發展定制化分析模型。未來,他計劃將研究範圍延伸至戰國簡帛材料,旨在構建一個涵蓋出土文獻與傳世文獻的互文性大數據庫。在漢學數字人文應用逐漸成熟的背景下,該研究將推動古典文獻學實現從微觀的音韻標注到宏觀網絡的技術革新。

 

講座回顧:

HKBUtube:https://hkbutube.lib.hkbu.edu.hk/inner.php?id=BTS-101279

Bilibili:https://www.bilibili.com/video/BV1m1cvzaEM4/?share_source=copy_web&vd_source=5078ed71343fd0bb61bd7b3508c26aa3

 

Lecture11 Lecture11