模糊性评分 | Elasticsearch: 权威指南

请注意:
本书基于 Elasticsearch 2.x 版本，有些内容可能已经过时。

» » »

模糊性评分edit

用户喜欢模糊查询。他们认为这种查询会魔法般的找到正确拼写组合。很遗憾，实际效果平平。

假设我们有1000个文档包含 ``Schwarzenegger`` ，只是一个文档中错误的拼写成了 ``Schwarzeneger`` 。根据词频/逆向文档频率（TF/IDF）理论，这个拼写错误的文档的相关度比拼写正确的更高，因为错误拼写出现在更少的文档中！

换句话说，如果我们对待模糊匹配类似其他匹配方法，我们将偏爱错误的拼写超过了正确的拼写，这会让用户抓狂。

模糊匹配不应被用于评分 — 只能在有拼写错误时扩大匹配项的范围。

默认情况下， match 查询给定所有的模糊匹配的固定评分为1。这可以满足在结果列表的末尾添加潜在的匹配记录，并且没有干扰非模糊查询的相关性评分。

模糊查询刚开始出现时很少能单独使用。而更多是作为一个 ``bigger(扩大搜索范围)`` 场景的部分功能特性，如 search-as-you-type (输入即搜索) 自动完成建议或 did-you-mean (你是不是想搜..) 短语 建议。