首頁 > MySQL > MySQL FullText plugin : bigram 試用

MySQL FullText plugin : bigram 試用

2009年7月22日 發表評論 閱讀評論

MySQL 內建的 FullText Engine 不支援中文是眾所皆知的

在 5.0 版之後 , 有所謂的 plugin 功能 , 其他非官方的人可以寫 plugin 去加強 MySQL 功能

而在 FullText 的部分也有人去寫

例如 Spinx ( http://sphinxsearch.com/ ) : 這套號稱支援中文全文索引 , 支援 myisam 及 innodb , 不過我還沒試 , 但好像不是同步作索引

另外我要介紹一個網站 http://sourceforge.net/projects/mysqlftppc/

這裡面有很多種 FullText Plugin , 其中有個叫 bigram 的支援中文喔 , 必須在 mysql 5.1 版以上運作

比較麻煩的是 , 要自己編譯 , 我在 FreeBSD 及 Linux 上都可以正常跑

大概拿公司的數據 80 萬筆資料(原始資料用了200M空間) , 欄位是 TEXT 的資料來做全文搜尋字串"三國志" 好了, 大概花了 0.02 秒 , 如果用 LIKE %三國志% 的方式 , 會花上 0.7 秒 …. 這真的是太驚人的效能

但 bigram 有個缺點是 , 索引佔用的空間挺大的 ,  所以空間要備足

由於這個 plugin 是即時的索引 , 所以一有資料新增 , 馬上就能搜尋 , 大家可以試試看喔

Categories: MySQL Tags: ,
  1. rogerger.py
    2009年8月12日15:27 | #1

    請問一下您的 Mecab 和 ICU 有安裝嗎?
    我弄不太清楚要如何開啟同步索引功能。
    謝謝。

  2. 2009年8月12日22:46 | #2

    @rogerger.py
    mecab 是甚麼我不知道
    你可以看我最新的安裝說明喔

    http://www.pigo.idv.tw/archives/353

    還有. bigram 本來就是同步索引了 , 不需要額外開啟

  3. Justmade
    2010年3月26日16:26 | #3

    請問有否試過安裝在Window? 我真接下載 .so 在Win32裡安裝不了…

  4. 2010年3月27日04:41 | #4

    Justmade :

    請問有否試過安裝在Window? 我真接下載 .so 在Win32裡安裝不了…

    那個沒試過喔. 不過你怎麼會有 .so 呢 ? 我記得要自己編譯啊 … , .so 檔應該是 Linux 用的吧

  5. Justmade
    2010年3月27日10:32 | #5

    @pigo
    謝謝回覆,那應是bi_gram 的一個分支在
    http://sites.google.com/site/mysqlbigram/home
    提供了一個可在i386使用的 .so
    不過我不知道可否在 Window 中使用
    在window 的mysql 執行 install plugin 時報不能開啟該檔案,但查 Process Activities 時有發現 Mysql 是有開啟該檔案的…應是錯誤訊息沒準確報出問題所在。

  6. 2010年3月27日20:47 | #6

    那個不是 win32 版的