控制文本标记和逃逸¶
目前,Redisearch使用一个非常简单的销售器,用于文档和一个稍微更复杂的查询的销售器。两者都允许对串的逃逸和令牌化进行控制。
注意:有一个不同的机制来授权文本和标记字段,此文档仅引用文本字段。对于标签字段,请参阅标签字段文档。
文本字段标记规则¶
所有标点符号和空格(除了下划线之外)将文档和查询分开到令牌中。例如任何特征
,。<> {} []“”:;!@ $%^&*() - + =〜
会将文本分解为条款。所以文本foo-bar.baz ...袋子
将被戳牌[Foo,Bar,Baz,Bag]
通过将反斜杠预先生到任何分隔符来逃避查询和文档中的分隔符。例如文本
你好\ -world你好世界
将被授予[你好 - 世界,你好,世界]
。笔记在大多数语言中,您需要在格式化文档或查询时需要额外的反斜杠,以表示实际反斜杠,因此redis-cli中的实际文本将被输入为你好世界
。underscores(
_
)不作为文档或查询中的分隔符。所以文本你好世界
将在象征化之后留下。剥离重复空间或标点符号。
在拉丁字符中,一切都被转换为小写。
第一个数字之前的反斜杠将以术语授予术语。这将翻译
-
签名原说,否则将使数字负数。之前添加反斜杠。
如果您正在搜索浮动。(ex。-20 - > {-20} vs - \ 20 - > {不是{20}})