簡體

語言文字應用


2003 年 第 4 期.頁 25 - 33

漢語信息處理中單字的構詞方式與合成詞的識別和理解

傅愛平

摘要

本文提出了漢語信息處理中關於單字構詞方式的基本問題,考察了目前對於這個問題的研究和應用情況。認為現有的統計性結論在未登錄詞處理中對於揭示單字構詞的規律缺乏有效的作用。究其原因,一是這些結論體現的是詞素組合成詞之後的結構性質,而不是組合過程中的規律;二是這些調查統計遵循以句法為本的觀點,而合成詞的結構方式主要是意合。按照意合的構詞觀點,詞素組合成詞的過程要受多種語言要素和非語言因素的制約。目前還只能運用不完備的構詞知識識別未登錄詞。文章最後給出了一組構詞規則的工程化應用實例。

關鍵字: 自然語言信息處理,漢語構詞,合成詞,意義結構方式,未登錄詞識別

[英文版 | 目錄 | 語言文字應用 | 其他文獻 | 訂講表格| 查詢 ]


Mail icon 如有任何意見或建議,歡迎電郵至 hkier-journal@cuhk.edu.hk