摘要 我們通過對1200萬字語料的統計得出,派生詞約佔詞條總數的8.66%,構成派生詞的詞綴共有188個。其中,後綴“者”所構成的派生詞詞條數最多,構詞成分最為複雜。我們採用基本詞表、詞例知識規則並結合詞語的搭配、共現頻率的混合策略對帶後綴“者”的派生詞進行了自動識別,封閉測試的精確率為93.06%,開放測試的精確率為82.40%。
摘要
我們通過對1200萬字語料的統計得出,派生詞約佔詞條總數的8.66%,構成派生詞的詞綴共有188個。其中,後綴“者”所構成的派生詞詞條數最多,構詞成分最為複雜。我們採用基本詞表、詞例知識規則並結合詞語的搭配、共現頻率的混合策略對帶後綴“者”的派生詞進行了自動識別,封閉測試的精確率為93.06%,開放測試的精確率為82.40%。
[英文版 | 目錄 | 語言文字應用 | 其他文獻 | 訂講表格| 查詢 ]