語言文字應用

2000 年第 3 期．頁 85 - 90

詞義排歧的一種語言模型

黃昌寧、李涓子

摘要

《同義詞詞林》（下簡稱《詞林》）中每個同義詞集對應於一個唯一的義類代碼。本文的基本假設是：當這些詞在文本中出現時，與它們前後同現的那些實詞在統計意義上是相似的。初步實驗表明，儘管根據分佈的聚類過程與《詞林》編者劃分同義詞集的機理完全不同，對詞語進行聚類的結果卻和《詞林》語義類的平均一致率高達80%以上。本研究的意義在於，提出一種對語言學家憑語感對詞的分類進行定量分析的方法，並且為計算機自動詞義標注時使用語言學知識奠定了基礎。

關鍵字：	`詞義排歧,語言模型`

_{[英文版 |
目錄 |
語言文字應用 |
其他文獻 |
訂講表格| 查詢 ]}

如有任何意見或建議，歡迎電郵至 hkier-journal@cuhk.edu.hk。