porter_stem 类型的词元过滤器,根据波特干扰算法转换词元流。
请注意,Porter Stem 词元过滤器的输入必须已经是小写,所以您需要使用 Lower Case Token Filter or Lower Case Tokenizer 在之前的分词器链上,以使其正常工作!例如,使用自定义分词器时,请确保过滤器列表中的 lowercase 过滤器位于 porter_stem 过滤器之前