Normalizer(规范化器)
normalizer 映射参数为关键字字段定义自定义的规范化过程。与用于文本字段的分析器(会生成多个词元)不同,规范化器使用一组词元过滤器将整个字段值转换为单个词元。当您定义一个规范化器时,关键字字段在存储之前会由指定的过滤器处理,同时保持文档的 _source 不变。
定义规范化器
以下请求创建一个名为 products 的索引,其中包含一个名为 my_normalizer 的自定义规范化器。该规范化器应用于 code 字段,该字段使用 trim 和 lowercase 过滤器:
PUT /products
{
"settings": {
"analysis": {
"normalizer": {
"my_normalizer": {
"type": "custom",
"filter": ["trim", "lowercase"]
}
}
}
},
"mappings": {
"properties": {
"code": {
"type": "keyword",
"normalizer": "my_normalizer"
}
}
}
}
当您将文档摄入索引时,code 字段会被规范化,即修剪多余的空格并将文本转换为小写:
PUT /products/_doc/1
{
"code": " ABC-123 EXTRA "
}
在查询中使用小写和修剪后的文本搜索已索引的文档:
POST /products/_search
{
"query": {
"term": {
"code": "abc-123 extra"
}
}
}
由于 code 字段被规范化,term 查询成功匹配到存储的文档:
{
...
"hits": {
"total": {
"value": 1,
"relation": "eq"
},
"max_score": 0.2876821,
"hits": [
{
"_index": "products",
"_id": "1",
"_score": 0.2876821,
"_source": {
"code": " ABC-123 EXTRA "
}
}
]
}
}