桶排序(bucket_sort)聚合

对其父多桶聚合的桶进行排序的父管道聚合。 可以指定零个或多个排序字段以及相应的排序顺序。 每个桶可以基于其_key_count或其子聚合进行排序。 此外,可以参数fromsize,以便截断结果桶。

与所有管道聚合一样,bucket_sort聚合在所有其他非管道聚合之后执行。 这意味着排序只适用于已经从父聚合返回的任何桶。 例如,如果父聚合是terms聚合,并其参数size设置为10,那么bucket_sort将只对这 10 个返回的词项桶进行排序。

语法

一个单独的bucket_sort看起来像这样:

{
    "bucket_sort": {
        "sort": [
            {"sort_field_1": {"order": "asc"}},
            {"sort_field_2": {"order": "desc"}},
            "sort_field_3"
        ],
        "from": 1,
        "size": 3
    }
}

这里,sort_field_1是要用作主要排序的变量的桶路径,其顺序是升序(asc)。

表 9. bucket_sort参数

参数名称 描述 是否必需 默认值

sort

排序所依据的字段列表。有关更多详细信息请参见排序(sort)

可选

from

给定的值之前位置的桶将被截断

可选

0

size

要返回的桶数。默认为父聚合的所有桶。

可选

gap_policy

在数据中发现间隙时应用的策略(更多详情请参考处理数据中的间隙)

可选

skip

下面这个代码片段按降序返回与总销售额最高的3个月相对应的桶:

POST /sales/_search
{
    "size": 0,
    "aggs" : {
        "sales_per_month" : {
            "date_histogram" : {
                "field" : "date",
                "calendar_interval" : "month"
            },
            "aggs": {
                "total_sales": {
                    "sum": {
                        "field": "price"
                    }
                },
                "sales_bucket_sort": {
                    "bucket_sort": {
                        "sort": [
                          {"total_sales": {"order": "desc"}}
                        ],
                        "size": 3
                    }
                }
            }
        }
    }
}

sort设置为按降序使用total_sales的值

size设置为3,表示将只返回total_sales中的前3个月

响应可能像下面这样:

{
   "took": 82,
   "timed_out": false,
   "_shards": ...,
   "hits": ...,
   "aggregations": {
      "sales_per_month": {
         "buckets": [
            {
               "key_as_string": "2015/01/01 00:00:00",
               "key": 1420070400000,
               "doc_count": 3,
               "total_sales": {
                   "value": 550.0
               }
            },
            {
               "key_as_string": "2015/03/01 00:00:00",
               "key": 1425168000000,
               "doc_count": 2,
               "total_sales": {
                   "value": 375.0
               },
            },
            {
               "key_as_string": "2015/02/01 00:00:00",
               "key": 1422748800000,
               "doc_count": 2,
               "total_sales": {
                   "value": 60.0
               },
            }
         ]
      }
   }
}

不排序截断

也可以使用这种聚合来截断结果桶,而不进行任何排序。 为此,只需使用from和/或size参数,无需指定sort

下面这个例子简单地截断结果,只返回第二个桶:

POST /sales/_search
{
    "size": 0,
    "aggs" : {
        "sales_per_month" : {
            "date_histogram" : {
                "field" : "date",
                "calendar_interval" : "month"
            },
            "aggs": {
                "bucket_truncate": {
                    "bucket_sort": {
                        "from": 1,
                        "size": 1
                    }
                }
            }
        }
    }
}

响应:

{
   "took": 11,
   "timed_out": false,
   "_shards": ...,
   "hits": ...,
   "aggregations": {
      "sales_per_month": {
         "buckets": [
            {
               "key_as_string": "2015/02/01 00:00:00",
               "key": 1422748800000,
               "doc_count": 2
            }
         ]
      }
   }
}