簡體

語言文字應用


2000 年 第 2 期.頁 72 - 77

大規模漢語標註語料庫的製作與使用

段慧明、松井久仁於、徐國偉、胡國昕、俞\士汶

摘要

隨著自然語言處理研究的深入開展,大規模語料庫的作用越來越重要。自從70年代美國製作了著名的Brown Corpus以來,世界上已製作了各種語料庫。富士通研究開發中心和北京大學計算語言學研究所合作,以人民日報語料為對象,製作大規模漢語標註語料庫,這個語料庫是世界上規模最大的標註語料庫之一。

[英文版 | 目錄 | 語言文字應用 | 其他文獻 | 訂講表格| 查詢 ]


Mail icon 如有任何意見或建議,歡迎電郵至 hkier-journal@cuhk.edu.hk