Elasticsearch内置有众多的分析器,可以在任何索引中使用,无需进一步配置:
Standard Analyzer(标准分析器)
standard(标准)分析器划分文本是通过词语来界定的,由Unicode文本分割算法定义。它删除大多数标点符号,将词语转换为小写,并支持删除停止词。
Simple Analyzer(简单分析器)
simple(简单)分析器每当遇到不是字母的字符时,将文本分割为词语。它将所有词语转换为小写。
Whitespace Analyzer(空白分析器)
whitespace(空白)分析器每当遇到任何空白字符时,都将文本划分为词语。它不会将词语转换为小写。
Stop Analyzer(停止分析器)
stop(停止)分析器类似simple(简单)分析器,也支持删除停用词。
Keyword Analyzer(关键字分析器)
keyword(关键字)分析器是一个noop(空)分析器,可以接受任何给定的文本,并输出与单个词语相同的文本。
Pattern Analyzer(模式分析器)
pattern(模式)分析器使用正则表达式将文本拆分为词语,它支持小写和停止字。
Language Analyzers(语言分析器)
Elasticsearch提供许多特定语言的分析器,例如english(英语)或french(法语)。
Fingerprint Analyzer(指纹分析器)
fingerprint(指纹)分析器是专门的分析器,可以创建用于重复检测的指纹。
如果你没有找到适合你需求的分析器,则可以创建一个自定义分析器,结合适当的字符过滤器,分词器和词语过滤器。