Microsoft SQL Serverの like検索が優秀な件について

この例は like '%ちゅーぶ%' なので全表検索で性能要件が満たせるケース専用だが、何の小細工もなしにこれが出来ることにはそれなりの価値があると思う。ずっと MS系でやってる人には当たり前なのかもしれないけど、オープンソースRDBMSではそれなりに頑張らないと出来ないんだよねコレ(というか like では出来ない, 多分)。
ちなみに索引検索をしたければSQL Serverには全文検索エンジンも付属している(明示的に選択しないとセットアップされない)が、現状(少なくとも日本語トークナイザは)N-GRAMに対応しておらず、分かち書きアルゴリズムに手を入れることも出来ないようなので、精度が微妙。だけど doc, pdf, ppt, vsdなどといった文書のバイナリオブジェクトに対しても索引が作れるため結構面白いことに使える。

0 件のコメント:
コメントを投稿
<< ホーム