摘要 本文對約2600萬字的2002年《人民日報》語料庫進行了字母詞語塊機器自動提取和人工後校對,然後利用程序提取出所有帶標點字母詞語塊。文章主要對帶標點字母詞語塊的自身特徵和字母詞語塊中標點的出現情況進行分析,目的是為字母詞語塊的規範和字母詞語塊自動識別和提取提供相關統計數據作參考。
摘要
本文對約2600萬字的2002年《人民日報》語料庫進行了字母詞語塊機器自動提取和人工後校對,然後利用程序提取出所有帶標點字母詞語塊。文章主要對帶標點字母詞語塊的自身特徵和字母詞語塊中標點的出現情況進行分析,目的是為字母詞語塊的規範和字母詞語塊自動識別和提取提供相關統計數據作參考。
[英文版 | 目錄 | 語言文字應用 | 其他文獻 | 訂講表格| 查詢 ]