原文地址: https://www.elastic.co/guide/cn/elasticsearch/guide/current/fuzzy-scoring.html, 版权归 www.elastic.co 所有
英文版地址: https://www.elastic.co/guide/en/elasticsearch/guide/current/fuzzy-scoring.html
英文版地址: https://www.elastic.co/guide/en/elasticsearch/guide/current/fuzzy-scoring.html
请注意:
本书基于 Elasticsearch 2.x 版本,有些内容可能已经过时。
本书基于 Elasticsearch 2.x 版本,有些内容可能已经过时。
模糊性评分edit
用户喜欢模糊查询。他们认为这种查询会魔法般的找到正确拼写组合。 很遗憾,实际效果平平。
假设我们有1000个文档包含 ``Schwarzenegger`` ,只是一个文档中错误的拼写成了 ``Schwarzeneger`` 。 根据 词频/逆向文档频率(TF/IDF) 理论,这个拼写错误的文档的相关度比拼写正确的更高,因为错误拼写出现在更少的文档中!
换句话说,如果我们对待模糊匹配类似其他匹配方法,我们将偏爱错误的拼写超过了正确的拼写,这会让用户抓狂。
模糊匹配不应被用于评分 — 只能在有拼写错误时扩大匹配项的范围。
默认情况下, match
查询给定所有的模糊匹配的固定评分为1。这可以满足在结果列表的末尾添加潜在的匹配记录,并且没有干扰非模糊查询的相关性评分。