跳到内容

控制文本标记和逃逸

目前,Redisearch使用一个非常简单的销售器,用于文档和一个稍微更复杂的查询的销售器。两者都允许对串的逃逸和令牌化进行控制。

注意:有一个不同的机制来授权文本和标记字段,此文档仅引用文本字段。对于标签字段,请参阅标签字段文档。

文本字段标记规则

  1. 所有标点符号和空格(除了下划线之外)将文档和查询分开到令牌中。例如任何特征,。<> {} []“”:;!@ $%^&*() - + =〜会将文本分解为条款。所以文本foo-bar.baz ...袋子将被戳牌[Foo,Bar,Baz,Bag]

  2. 通过将反斜杠预先生到任何分隔符来逃避查询和文档中的分隔符。例如文本你好\ -world你好世界将被授予[你好 - 世界,你好,世界]笔记在大多数语言中,您需要在格式化文档或查询时需要额外的反斜杠,以表示实际反斜杠,因此redis-cli中的实际文本将被输入为你好世界

  3. underscores(_)不作为文档或查询中的分隔符。所以文本你好世界将在象征化之后留下。

  4. 剥离重复空间或标点符号。

  5. 在拉丁字符中,一切都被转换为小写。

  6. 第一个数字之前的反斜杠将以术语授予术语。这将翻译-签名原说,否则将使数字负数。之前添加反斜杠如果您正在搜索浮动。(ex。-20 - > {-20} vs - \ 20 - > {不是{20}})

Baidu