簡體

語言文字應用


2000 年 第 3 期.頁 85 - 90

詞義排歧的一種語言模型

黃昌寧、李涓子

摘要

《同義詞詞林》(下簡稱《詞林》)中每個同義詞集對應於一個唯一的義類代碼。本文的基本假設是:當這些詞在文本中出現時,與它們前後同現的那些實詞在統計意義上是相似的。初步實驗表明,儘管根據分佈的聚類過程與《詞林》編者劃分同義詞集的機理完全不同,對詞語進行聚類的結果卻和《詞林》語義類的平均一致率高達80%以上。本研究的意義在於,提出一種對語言學家憑語感對詞的分類進行定量分析的方法,並且為計算機自動詞義標注時使用語言學知識奠定了基礎。

關鍵字: 詞義排歧,語言模型

[英文版 | 目錄 | 語言文字應用 | 其他文獻 | 訂講表格| 查詢 ]


Mail icon 如有任何意見或建議,歡迎電郵至 hkier-journal@cuhk.edu.hk