Normalizer(规范化器)

normalizer 映射参数为关键字字段定义自定义的规范化过程。与用于文本字段的分析器(会生成多个词元)不同,规范化器使用一组词元过滤器将整个字段值转换为单个词元。当您定义一个规范化器时,关键字字段在存储之前会由指定的过滤器处理,同时保持文档的 _source 不变。

定义规范化器

以下请求创建一个名为 products 的索引,其中包含一个名为 my_normalizer 的自定义规范化器。该规范化器应用于 code 字段,该字段使用 trimlowercase 过滤器:

PUT /products
{
  "settings": {
    "analysis": {
      "normalizer": {
        "my_normalizer": {
          "type": "custom",
          "filter": ["trim", "lowercase"]
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "code": {
        "type": "keyword",
        "normalizer": "my_normalizer"
      }
    }
  }
}

当您将文档摄入索引时,code 字段会被规范化,即修剪多余的空格并将文本转换为小写:

PUT /products/_doc/1
{
  "code": "  ABC-123 EXTRA  "
}

在查询中使用小写和修剪后的文本搜索已索引的文档:

POST /products/_search
{
  "query": {
    "term": {
      "code": "abc-123 extra"
    }
  }
}

由于 code 字段被规范化,term 查询成功匹配到存储的文档:

{
...
  "hits": {
    "total": {
      "value": 1,
      "relation": "eq"
    },
    "max_score": 0.2876821,
    "hits": [
      {
        "_index": "products",
        "_id": "1",
        "_score": 0.2876821,
        "_source": {
          "code": "  ABC-123 EXTRA  "
        }
      }
    ]
  }
}