2007年2月10日 星期六

CKIP Auto Tagger

說明

依據 CKIP 標準製作的 POS tagger。

安裝方法和注意事項

  1. 解壓縮 CKIP_AutoTagger。要注意的是,該目錄路徑中不能包含有空白字元。如 D:\Tools\CKIP_AutoTagger\CKIPAT
  2. 環境變數 PATH 中加入解壓縮後的目錄。如:SET PATH=%PATH%;D:\Tools\CKIP_AutoTagger\CKIPAT
  3. 接著在下載 Utility.dll 檔,並將之加入到專案的參考中
  4. 在程式中可以以如下的方式呼叫:

Token[] segments = Utility.CKIPSeg.Instance().Segment(input);

每個 Token 物件的 PartOfSpeech 屬性即為其 POS。

注意

AutoTag 會掉字元!比如:

將不會產生對應的 POS。另外,下列字元會被轉換(原字元:轉換輸出為):

  • —:-