簡體

語言文字應用


2005 年 第 1 期.頁 82 - 87

字母詞語塊中“標點”的使用狀況考察

關潤芝、楊建國

摘要

本文對約2600萬字的2002年《人民日報》語料庫進行了字母詞語塊機器自動提取和人工後校對,然後利用程序提取出所有帶標點字母詞語塊。文章主要對帶標點字母詞語塊的自身特徵和字母詞語塊中標點的出現情況進行分析,目的是為字母詞語塊的規範和字母詞語塊自動識別和提取提供相關統計數據作參考。

關鍵字: 字母詞語塊,標點,自動提取

[英文版 | 目錄 | 語言文字應用 | 其他文獻 | 訂講表格| 查詢 ]


Mail icon 如有任何意見或建議,歡迎電郵至 hkier-journal@cuhk.edu.hk