在默认情况下许多字段都是 indexed(被索引的),这使得它们可以被搜索.反向索引允许查询通过唯一性排序的 term
(词根)列表来查询 term
(词根),并且可以立即访问包含该 term
(词根)的文档.
脚本中的排序,聚合和对字段值的访问需要一种不同的数据访问模式.我们不需要先查找 term
(词根),再寻找对应的 documents
(文档),而是可以先查找 document
(文档),再查找它在一个字段中的 terms
(词根).
Doc values 是在 document 索引时间内构建在磁盘上的数据结构,这使得上面所说的数据访问模式成为可能.它们存储与 _source 相同的值,但是以列为主的方式存储.这使得排序和聚合效率更高.几乎所有字段类型都支持 Doc values ,除了 the notable exception of analyzed string fields.
默认情况下,支持 doc values 的所有字段都是开启的.如果你确定不需要在字段上进行排序和聚合,活从脚本中访问字段值,则可以禁用 doc values 来节省磁盘空间.
curl -XPUT 'localhost:9200/my_index?pretty' -H 'Content-Type: application/json' -d'
{
"mappings": {
"my_type": {
"properties": {
"status_code": { # 1
"type": "keyword"
},
"session_id": { # 2
"type": "keyword",
"doc_values": false
}
}
}
}
}
'
| 1 | status_code
默认开启 doc_values
|
| 2 | session_id
关闭 doc_values
,但是仍然可以被查询. |