字符串长度超过 ignore_above 设置的不会被索引和存储.
curl -XPUT 'localhost:9200/my_index?pretty' -H 'Content-Type: application/json' -d'
{
"mappings": {
"my_type": {
"properties": {
"message": {
"type": "keyword",
"ignore_above": 20 # 1
}
}
}
}
}
'
curl -XPUT 'localhost:9200/my_index/my_type/1?pretty' -H 'Content-Type: application/json' -d' # 2
{
"message": "Syntax error"
}
'
curl -XPUT 'localhost:9200/my_index/my_type/2?pretty' -H 'Content-Type: application/json' -d' # 3
{
"message": "Syntax error with some long stacktrace"
}
'
curl -XGET 'localhost:9200/_search?pretty' -H 'Content-Type: application/json' -d' # 4
{
"aggs": {
"messages": {
"terms": {
"field": "message"
}
}
}
}
| 1 | 字段会忽略超过20个字符的字符串. | | 2 | 这个 document 成功被索引. | | 3 | 这个 document 会被索引,但是不会索引 message 字段. | | 4 | 搜索返回两个文档,但只有第一个存在于 terms(词条)聚合中. |
tip
ignore_above 设置允许在相同索引的相同名称的字段有不同的配置,可以使用 PUT mapping API 在现有字段上更新其值。
此选项对于防止Lucene term(词条)长度超过32766是有用的.
ignore_above 的值是字符数,但 Lucene 计数的是字节。所以如果你使用具有许多非ASCII字符的UTF-8文本,则可能需要将限制设置为 32766/3 = 10922,因为UTF-8字符可能占用至多3个字节。