簡體

語言文字應用


2005 年 第 1 期.頁 137 - 143

漢語動賓搭配自動識別研究

王霞

摘要

搭配是一種詞與詞之間的組合關係,搭配的自動提取,是自動句法分析的重要環節,同時也是重要的知識來源。本文在分析搭配性質的基礎上提出了一個基於統計的動賓搭配自動識別的算法。我們從經過了人工標注的50萬詞的訓練語料中獲取數據,並把所獲數據用於自動識別。封閉測試和開放測試的正確率分別是94.7%和81.2%。實驗結果表明,從訓練語料中獲取的數據可以比較有效地用於自動識別,本文選取的四項指標也是自動識別比較合適的統計量。

關鍵字: 動賓搭配,句法分析,概率,分布

[英文版 | 目錄 | 語言文字應用 | 其他文獻 | 訂講表格| 查詢 ]


Mail icon 如有任何意見或建議,歡迎電郵至 hkier-journal@cuhk.edu.hk