Analyzers(分析器)

Elasticsearch内置有众多的分析器,可以在任何索引中使用,无需进一步配置:

Standard Analyzer(标准分析器)

standard(标准)分析器划分文本是通过词语来界定的,由Unicode文本分割算法定义。它删除大多数标点符号,将词语转换为小写,并支持删除停止词。

Simple Analyzer(简单分析器)

simple(简单)分析器每当遇到不是字母的字符时,将文本分割为词语。它将所有词语转换为小写。

Whitespace Analyzer(空白分析器)

whitespace(空白)分析器每当遇到任何空白字符时,都将文本划分为词语。它不会将词语转换为小写。

Stop Analyzer(停止分析器)

stop(停止)分析器类似simple(简单)分析器,也支持删除停用词。

Keyword Analyzer(关键字分析器)

keyword(关键字)分析器是一个noop(空)分析器,可以接受任何给定的文本,并输出与单个词语相同的文本。

Pattern Analyzer(模式分析器)

pattern(模式)分析器使用正则表达式将文本拆分为词语,它支持小写和停止字。

Language Analyzers(语言分析器)

Elasticsearch提供许多特定语言的分析器,例如english(英语)或french(法语)。

Fingerprint Analyzer(指纹分析器)

fingerprint(指纹)分析器是专门的分析器,可以创建用于重复检测的指纹。

Custom analyzers(定制分析器)

如果你没有找到适合你需求的分析器,则可以创建一个自定义分析器,结合适当的字符过滤器,分词器和词语过滤器。