原文地址: https://www.elastic.co/guide/cn/elasticsearch/guide/current/standard-analyzer.html, 版权归 www.elastic.co 所有
英文版地址: https://www.elastic.co/guide/en/elasticsearch/guide/current/standard-analyzer.html
英文版地址: https://www.elastic.co/guide/en/elasticsearch/guide/current/standard-analyzer.html
请注意:
本书基于 Elasticsearch 2.x 版本,有些内容可能已经过时。
本书基于 Elasticsearch 2.x 版本,有些内容可能已经过时。
标准分析器edit
任何全文检索的字符串域都默认使用 standard
分析器。
如果我们想要一个 自定义
分析器 ,可以按照如下定义方式重新实现 标准
分析器:
{ "type": "custom", "tokenizer": "standard", "filter": [ "lowercase", "stop" ] }
在 归一化词元 (标准化词汇单元)和 停用词: 性能与精度 (停用词)中,我们讨论了 lowercase
(小写字母)和 stop
(停用词) 词汇单元过滤器 ,但是现在,我们专注于 standard
tokenizer (标准分词器)。