矩阵统计聚合
matrix_stats 聚合以矩阵形式为多个字段生成高级统计数据。
以下示例为 taxful_total_price 和 products.base_price 字段以矩阵形式返回高级统计数据:
GET opensearch_dashboards_sample_data_ecommerce/_search
{
"size": 0,
"aggs": {
"matrix_stats_taxful_total_price": {
"matrix_stats": {
"fields": ["taxful_total_price", "products.base_price"]
}
}
}
}
示例响应
...
"aggregations" : {
"matrix_stats_taxful_total_price" : {
"doc_count" : 4675,
"fields" : [
{
"name" : "products.base_price",
"count" : 4675,
"mean" : 34.994239430147196,
"variance" : 360.5035285833703,
"skewness" : 5.530161335032702,
"kurtosis" : 131.16306324042148,
"covariance" : {
"products.base_price" : 360.5035285833703,
"taxful_total_price" : 846.6489362233166
},
"correlation" : {
"products.base_price" : 1.0,
"taxful_total_price" : 0.8444765264325268
}
},
{
"name" : "taxful_total_price",
"count" : 4675,
"mean" : 75.05542864304839,
"variance" : 2788.1879749835402,
"skewness" : 15.812149139924037,
"kurtosis" : 619.1235507385902,
"covariance" : {
"products.base_price" : 846.6489362233166,
"taxful_total_price" : 2788.1879749835402
},
"correlation" : {
"products.base_price" : 0.8444765264325268,
"taxful_total_price" : 1.0
}
}
]
}
}
}
下表列出了所有响应字段。
| 统计量 | 描述 |
|---|---|
count |
测量的样本数量。 |
mean |
从样本测量的字段平均值。 |
variance |
所测量字段的值围绕其平均值的分散程度。方差越大,表示偏离平均值越远。 |
skewness |
字段值围绕均值分布的对称性度量。 |
kurtosis |
分布尾部重度的度量。尾部越轻,峰度越小。尾部越重,峰度越大。要了解峰度,请参阅维基百科。 |
covariance |
两个字段之间联合变异性的度量。正值表示它们的值同向移动,负值则相反。 |
correlation |
两个字段之间关系强度的度量。有效值范围在 [-1, 1] 之间。值为 -1 表示负相关,值为 1 表示正相关。值为 0 表示它们之间没有可识别的关系。 |