摘要
《同義詞詞林》(下簡稱《詞林》)中每個同義詞集對應於一個唯一的義類代碼。本文的基本假設是:當這些詞在文本中出現時,與它們前後同現的那些實詞在統計意義上是相似的。初步實驗表明,儘管根據分佈的聚類過程與《詞林》編者劃分同義詞集的機理完全不同,對詞語進行聚類的結果卻和《詞林》語義類的平均一致率高達80%以上。本研究的意義在於,提出一種對語言學家憑語感對詞的分類進行定量分析的方法,並且為計算機自動詞義標注時使用語言學知識奠定了基礎。
關鍵字: | 詞義排歧,語言模型 |
---|
[英文版 | 目錄 | 語言文字應用 | 其他文獻 | 訂講表格| 查詢 ]