矩阵统计聚合

matrix_stats 聚合以矩阵形式为多个字段生成高级统计数据。 以下示例为 taxful_total_priceproducts.base_price 字段以矩阵形式返回高级统计数据:

GET opensearch_dashboards_sample_data_ecommerce/_search
{
  "size": 0,
  "aggs": {
    "matrix_stats_taxful_total_price": {
      "matrix_stats": {
        "fields": ["taxful_total_price", "products.base_price"]
      }
    }
  }
}

示例响应

...
"aggregations" : {
  "matrix_stats_taxful_total_price" : {
    "doc_count" : 4675,
    "fields" : [
      {
        "name" : "products.base_price",
        "count" : 4675,
        "mean" : 34.994239430147196,
        "variance" : 360.5035285833703,
        "skewness" : 5.530161335032702,
        "kurtosis" : 131.16306324042148,
        "covariance" : {
          "products.base_price" : 360.5035285833703,
          "taxful_total_price" : 846.6489362233166
        },
        "correlation" : {
          "products.base_price" : 1.0,
          "taxful_total_price" : 0.8444765264325268
        }
      },
      {
        "name" : "taxful_total_price",
        "count" : 4675,
        "mean" : 75.05542864304839,
        "variance" : 2788.1879749835402,
        "skewness" : 15.812149139924037,
        "kurtosis" : 619.1235507385902,
        "covariance" : {
          "products.base_price" : 846.6489362233166,
          "taxful_total_price" : 2788.1879749835402
        },
        "correlation" : {
          "products.base_price" : 0.8444765264325268,
          "taxful_total_price" : 1.0
        }
      }
    ]
  }
 }
}

下表列出了所有响应字段。

统计量 描述
count 测量的样本数量。
mean 从样本测量的字段平均值。
variance 所测量字段的值围绕其平均值的分散程度。方差越大,表示偏离平均值越远。
skewness 字段值围绕均值分布的对称性度量。
kurtosis 分布尾部重度的度量。尾部越轻,峰度越小。尾部越重,峰度越大。要了解峰度,请参阅维基百科
covariance 两个字段之间联合变异性的度量。正值表示它们的值同向移动,负值则相反。
correlation 两个字段之间关系强度的度量。有效值范围在 [-1, 1] 之间。值为 -1 表示负相关,值为 1 表示正相关。值为 0 表示它们之间没有可识别的关系。