sphinx
Contents
sphinx是一款基于SQL的全文搜索引擎,可以理解为对MySQL等数据库中全文搜索特性的另外一种实现。它本身可被整合到MySQL等数据库中,成为一种新的存储引擎;此外,还为一些脚本语言设计了API接口。sphinx从功能上讲比较全面。 它的权重算法也是基于BM25的,这个跟xapian一样,都是目前IR-REL(检索相关度)系列算法里最好的。 目前有两点还搞不太明白:一是它的切词算法,可能它不是通过切词建立索引的,或者是把每个字都切开?二是它的索引如何和MySQL数据库保持同步,是定期同步还是实时同步?准备深入了解一下,虽然不会有实际用途。
Author
LastMod 2008-03-04