簡體

語言文字應用


2001 年 第 1 期.頁 14 - 18

基於統計和規則的中文姓名自動辨識

季姮、羅振聲

摘要

中文姓名的辨識是自動分詞、自動文摘的基礎。獨立於自動分詞,我們運用姓名用字概率和規則,設計並實現了一個中文姓名辨識系統。對207757字語料進行了測試,召回率達到92.57%,精確率達到80.35%,且速度較快。

關鍵字: 概率分佈,規則篩選,兼類姓,專有人名,特殊候選姓名對

[英文版 | 目錄 | 語言文字應用 | 其他文獻 | 訂講表格| 查詢 ]


Mail icon 如有任何意見或建議,歡迎電郵至 hkier-journal@cuhk.edu.hk