项目场景:
最近在做需求开发的时候,有个需求,需要根据关键字去ES中进行模糊搜索。于是首先想到了wildcard查询,根据关键字,利用*通配符,类似于mysql中的like一样进行模糊搜索。
问题描述
但是遇到了问题就是,根据单个汉字能正常模糊搜索,多个汉字就无法查询出数据。
单个汉字正常查询:
多个汉字无法查出数据:
于是我就百度找解决方案,很多人说都说在查询关键字后面加 .keyword 就可以正常查询了,于是我接着尝试,
结果还是不能正常查询,而且原来单个汉字能查询的,现在也不行了
文章来源:https://uudwc.com/A/vyAj
原因分析:
于是我怀疑是字段类型导致的,就有了下面这个我自己建的blog的测试索引。
咱们现在只关心索引中的name,newName1,newName2,newName3这4个字段,可以看到这4个字段的数据类型不同。
现在创建一条数据,
文章来源地址https://uudwc.com/A/vyAj
- 根据name模糊查询
可以看到在keyword类型下,无论单个汉字,还是多个汉字都可以正常查询 - newName1的类型为text,最上面就是这种情况,单个汉字可以,多个汉字不行
- newName2的类型为wildcard,跟keyword情况一样
- newName3的类型为text,但是附加了keyword类型
单个汉字正常查询
多个汉字不能查询
加上keyword可以正常查询
总结:
- text类型,es会分词导致多个汉字不能正常正常查询
- keyword不分词可以正常查询
- wildcard和keyword类似
- text类型附加keyword类型,相当于支持两种类型,默认text,但是可以通过关键字加.keyword变成keyword类型