摘要
20年來中文信息處理取得了巨大成績,這是有目共睹的。當前擺在學界面前的一個重要任務是確立全局的戰略目標,並盡快在一些社會急需的發展方向上取得實質性的突破。為此,首先要澄清某些認識,比如中文信息處理是不是一定要在漢語理解的基礎上推進?對於解決中文信息處理的一些急需課題來說,究竟什麼方法是最適用的?本文首先對國內外自然語言處理的歷史作了一個簡短的回顧,說明從小規模受限語言處理走向大規模真實文本處理,是一個不可抗拒的歷史潮流。並通過一些具體的實例來說明:統計語言模型能解決什麼問題?它為什麼在一些有可比評測的課題上連連勝出?借此闡明,具有統一測試數據和統一計分方法的可比評測是推動科學技術進步的有力槓桿。我們應當拿起這個武器。
關鍵字: | 中文信息處理,統計語言模型 |
---|
[英文版 | 目錄 | 語言文字應用 | 其他文獻 | 訂講表格| 查詢 ]