zzong2019 发表于 2024-2-13 23:25:33

如何在mysql中使用正则表达式确认一个长语句中是否包含某个关键词

在一张名为posts的数据表中,包含keywords和content两列,现在需要判断keywords列的值是否在content列中的一个长句中。
例如:
1. keywords为war,长句为warning:404 not found,waring虽然包含war三个字母但是并不是同一个单词,因此不匹配;
2. keywords为house,长句为hello,welcome to my house,house在语句中出现过,可以匹配;
尝试编写如下:select * from posts where content regexp concat('\s',word,'\s') or content regexp concat('^',word,'\s') or content regexp concat('\s',word,'$') ,但无法得到正确结果,应该如何改进呢?

FishC 发表于 2024-2-13 23:25:34

zzong2019 发表于 2024-02-13 23:28
谢谢解答,按照你提示的方法运行了一下,系统报错:Il ...

抱歉,我之前给出的代码有一处错误。在MySQL中,正则表达式中的方括号`[]`并不是用来表示单词的边界,而是用来表示字符类,用于匹配某个字符集中的任意一个字符。要想正确地匹配单词的边界,可以使用`\b`元字符。修改后的代码如下:SELECT *FROM postsWHERE content REGEXP CONCAT('\\b', keywords, '\\b');这段代码中,`\\b`表示单词的边界。使用双斜杠`\\`是因为在字符串中需要转义斜杠。这样就能够正确地匹配完整的单词,而不是包含该关键词的其他单词。希望这次能够解决你的问题,如果还有其他疑问,请随时提问!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

FishC 发表于 2024-2-13 23:25:49

你的思路是正确的,但是需要注意正则表达式中的一些问题。在MySQL中,可以使用REGEXP关键字进行正则表达式匹配。

你尝试的代码有一些问题,即`'\s'`并不是MySQL中的正则表达式元字符,它代表的是字母"s"。在MySQL的正则表达式中,你可以使用`[[:<:]]`和`[[:>:]]`来匹配单词的边界。

下面是一个修改后的示例代码:

SELECT *
FROM posts
WHERE content REGEXP CONCAT('[[:<:]]', keywords, '[[:>:]]');

这段代码使用`REGEXP`函数来匹配`content`列中是否包含`keywords`列的值。`CONCAT`函数用于将正则表达式的各个部分连接起来。

在正则表达式中,`[[:<:]]`表示单词的开始,`[[:>:]]`表示单词的结束。这样可以确保我们匹配的是完整的单词,而不是包含该关键词的其他单词。

这个代码应该能够解决你的问题。希望能对你有所帮助!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

zzong2019 发表于 2024-2-13 23:28:47

FishC 发表于 2024-2-13 23:25
你的思路是正确的,但是需要注意正则表达式中的一些问题。在MySQL中,可以使用REGEXP关键字进行正则表达式 ...

谢谢解答,按照你提示的方法运行了一下,系统报错:Illegal argument to a regular expression.非法的正则表达式,还应该怎么解决呢?
页: [1]
查看完整版本: 如何在mysql中使用正则表达式确认一个长语句中是否包含某个关键词