原文地址: https://www.elastic.co/guide/cn/elasticsearch/guide/current/geo-distance.html, 版权归 www.elastic.co 所有
英文版地址: https://www.elastic.co/guide/en/elasticsearch/guide/current/geo-distance.html
英文版地址: https://www.elastic.co/guide/en/elasticsearch/guide/current/geo-distance.html
请注意:
本书基于 Elasticsearch 2.x 版本,有些内容可能已经过时。
本书基于 Elasticsearch 2.x 版本,有些内容可能已经过时。
地理距离过滤器 (Geo Distance Filter)edit
地理距离过滤器( geo_distance
)以给定位置为圆心画一个圆,来找出那些地理坐标落在其中的文档:
GET /attractions/restaurant/_search { "query": { "filtered": { "filter": { "geo_distance": { "distance": "1km", "location": { "lat": 40.715, "lon": -73.988 } } } } } }
找出所有与指定点距离在 |
|
中心点可以表示为字符串,数组或者(如示例中的)对象。详见 经纬度坐标格式。 |
地理距离过滤器计算代价昂贵。为了优化性能,Elasticsearch 先画一个矩形框来围住整个圆形,这样就可以先用消耗较少的盒模型计算方式来排除掉尽可能多的文档。 然后只对落在盒模型内的这部分点用地理距离计算方式处理。
你需要判断你的用户,是否需要如此精确的使用圆模型来做距离过滤?通常使用矩形模型 bounding box 是比地理距离更高效的方式,并且往往也能满足应用需求。
更快的地理距离计算edit
两点间的距离计算,有多种牺牲性能换取精度的算法:
-
arc
-
最慢但最精确的是
arc
计算方式,这种方式把世界当作球体来处理。不过这种方式的精度有限,因为这个世界并不是完全的球体。 -
plane
-
plane
计算方式把地球当成是平坦的,这种方式快一些但是精度略差。在赤道附近的位置精度最好,而靠近两极则变差。 -
sloppy_arc
-
如此命名,是因为它使用了 Lucene 的
SloppyMath
类。这是一种用精度换取速度的计算方式, 它使用 Haversine formula 来计算距离。它比arc
计算方式快 4 到 5 倍,并且距离精度达 99.9%。这也是默认的计算方式。
你可以参考下例来指定不同的计算方式:
GET /attractions/restaurant/_search { "query": { "filtered": { "filter": { "geo_distance": { "distance": "1km", "distance_type": "plane", "location": { "lat": 40.715, "lon": -73.988 } } } } } }
你的用户真的会在意一个餐馆落在指定圆形区域数米之外吗?一些地理位置相关的应用会有较高的精度要求;但大部分实际应用场景中,使用精度较低但响应更快的计算方式可能更好。
地理距离区间过滤器 (geo_distance_range Filter)edit
geo_distance
和 geo_distance_range
过滤器的唯一差别在于后者是一个环状的,它会排除掉落在内圈中的那部分文档。
指定到中心点的距离也可以换一种表示方式:指定一个最小距离(使用 gt
或者 gte
)和最大距离(使用 lt
和 lte
),就像使用 range
过滤器一样: