sennaを使ってみる

まずは動作確認。きちんとインストールされているかを見ます。

テーブル作成。何も指定しなければ、自動的に単語インデックスmecabが指定されます。

  CREATE TABLE test (
    id INTEGER AUTO_INCREMENT,
    PRIMARY KEY (id),
    text TEXT NOT NULL,
    FULLTEXT INDEX (text)
  );

で、SENNAのコマンドでSENNAの動作検証。

SHOW SENNA STATUS\G
         【1. row】 
                  Table: test
               Key_name: text
            Column_name: text
               Encoding: utf8
             Index_type: MECAB
              Normalize: ON
            Split_alpha: OFF
            Split_digit: OFF
           Split_symbol: OFF
     Initial_n_segments: 512
        Senna_keys_size: 0
   Senna_keys_file_size: 4268032
     Senna_lexicon_size: 0
Senna_lexicon_file_size: 4268032
     Senna_inv_seg_size: 167936
   Senna_inv_chunk_size: 135168
1 row in set (0.01 sec)

こんな感じで表示されればOK。

Encoding: utf8
Index_type: MECAB

ここがEUCとかNGRAMとかになっていないかチェックすること。
時々、間違った文字コードでデータを入れてしまうとutf8じゃなくなる場合があるので注意。