SQL里的正则表达式！

admin • 2022年10月11日 18:17 • SQL技巧

SQL里的正则表达式！

SQL语句还可以搭配正则表达式作为查询条件，很是有用。

REGEXP_LIKE(匹配)
REGEXP_INSTR (包含)
REGEXP_REPLACE(替换)
REGEXP_SUBSTR(提取)

表 1：定位元字符

元字符	说明
^	使表达式定位至一行的开头
$	使表达式定位至一行的末尾

表 2：量词或重复操作符

量词	说明
*	匹配 0 次或更多次
?	匹配 0 次或 1 次
+	匹配 1 次或更多次
{m}	正好匹配 m 次
{m,}	至少匹配 m 次
{m, n}	至少匹配 m 次但不超过 n 次

表 3：预定义的 POSIX 字符类

字符类	说明
[:alpha:]	字母字符
[:lower:]	小写字母字符
[:upper:]	大写字母字符
[:digit:]	数字
[:alnum:]	字母数字字符
[:space:]	空白字符（禁止打印），如回车符、换行符、竖直制表符和换页符
[:punct:]	标点字符
[:cntrl:]	控制字符（禁止打印）
[:print:]	可打印字符

表 4：表达式的替换匹配和分组

元字符		说明
\|	替换	分隔替换选项，通常与分组操作符 () 一起使用
( )	分组	将子表达式分组为一个替换单元、量词单元或后向引用单元（参见“后向引用”部分）
[char]	字符列表	表示一个字符列表；一个字符列表中的大多数元字符（除字符类、^ 和 - 元字符之外）被理解为文字

表 5：REGEXP_LIKE 操作符

语法	说明
REGEXP_LIKE(source_string, pattern [, match_parameter])	source_string 支持字符数据类型（CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB，但不包括 LONG）。pattern 参数是正则表达式的另一个名称。match_parameter 允许可选的参数（如处理换行符、保留多行格式化以及提供对区分大小写的控制）。

表 6：REGEXP_INSTR 函数

语法	说明
REGEXP_INSTR(source_string, pattern [, start_position [, occurrence [, return_option [, match_parameter]]]])	该函数查找 pattern ，并返回该模式的第一个位置。您可以随意指定您想要开始搜索的 start_position。 occurrence 参数默认为 1，除非您指定您要查找接下来出现的一个模式。return_option 的默认值为 0，它返回该模式的起始位置；值为 1 则返回符合匹配条件的下一个字符的起始位置。

表 7： 5 位数字加 4 位邮政编码表达式的说明

语法	说明
	必须匹配的空白
[:digit:]	POSIX 数字类
]	字符列表的结尾
{5}	字符列表正好重复出现 5 次
(	子表达式的开头
-	一个文字连字符，因为它不是一个字符列表内的范围元字符
[	字符列表的开头
[:digit:]	POSIX [:digit:]类
[	字符列表的开头
]	字符列表的结尾
{4}	字符列表正好重复出现 4 次
)	结束圆括号，结束子表达式
?	? 量词匹配分组的子表达式 0 或 1 次，从而使得 4 位代码可选
$	定位元字符，指示行尾

表 8：REGEXP_SUBSTR 函数

语法	说明
REGEXP_SUBSTR(source_string, pattern [, position [, occurrence [, match_parameter]]])	REGEXP_SUBSTR 函数返回匹配模式的子字符串。

表 9： REGEXP_REPLACE 函数

语法	说明
REGEXP_REPLACE(source_string, pattern [, replace_string [, position [,occurrence, [match_parameter]]]])	该函数用一个指定的 replace_string 来替换匹配的模式，从而允许复杂的“搜索并替换”操作。

表 10：后向引用元字符

元字符		说明
digit	反斜线	紧跟着一个 1 到 9 之间的数字，反斜线匹配之前的用括号括起来的第 digit 个子表达式。（注意：反斜线在正则表达式中有另一种意义，取决于上下文，它还可能表示 Escape 字符。

表 11：模式交换正则表达式的说明

正则表达式项目	说明
(	第一个子表达式的开头
.	匹配除换行符之外的任意单字符
*	重复操作符，匹配之前的 . 元字符 0 到 n 次
)	第一个子表达式的结尾；匹配结果在 1 中获取（在这个例子中，结果为 Ellen。）
	必须存在的空白
(	第二个子表达式的开头
.	匹配除换行符之外的任意单个字符
*	重复操作符，匹配之前的 . 元字符 0 到 n 次
)	第二个子表达式的结尾；匹配结果在 2 中获取（在这个例子中，结果为 Hildi。）
	空白
(	第三个子表达式的开头
.	匹配除换行符之外的任意单字符
*	重复操作符，匹配之前的 . 元字符 0 到 n 次
)	第三个子表达式的结尾；匹配结果在 3 中获取（在这个例子中，结果为 Smith。）

表 12：社会保险号码正则表达式的说明

正则表达式项目	说明
^	行首字符（正则表达式在匹配之前不能有任何前导字符。）
(	开始子表达式并列出用 \| 元字符分开的可替换选项
[	字符列表的开头
[:digit:]	POSIX 数字类
]	字符列表的结尾
{3}	字符列表正好重复出现 3 次
-	连字符
[	字符列表的开头
[:digit:]	POSIX 数字类
]	字符列表的结尾
{2}	字符列表正好重复出现 2 次
-	另一个连字符
[	字符列表的开头
[:digit:]	POSIX 数字类
]	字符列表的结尾
{4}	字符列表正好重复出现 4 次
\|	替换元字符；结束第一个选项并开始下一个替换表达式
[	字符列表的开头
[:digit:]	POSIX 数字类
]	字符列表的结尾
{9}	字符列表正好重复出现 9 次
)	结束圆括号，结束用于替换的子表达式组
$	定位元字符，指示行尾；没有额外的字符能够符合模式

SELECT * FORM. tKHXX where REGEXP_LIKE(SJHM, '^[1]{1}[35]{1}[[:digit:]]{9}$'
针对这个表达式解释一下
^ 表示开始
$ 表示结束
[]内部为匹配范围
{}里的内容表时个数，有几位

手机号码的特点是以 1开头接着是3或5再加9位的数字所以这么理解
1开头表达式为 ^[1]{1} 意为开始1位里包含1
3或5 表达式为 [35]{1}
9位数字结束为: [[:digit:]]{9}$ 这里[:digit:]为特殊写法，代表为数字再加个结束符$

如果大家有其他的方法，或者想要知道哪方面的办公技巧，下方评论哦~

学习资料见知识星球。

以上就是今天要分享的技巧，你学会了吗？若有什么问题，欢迎在下方留言。

快来试试吧，小琥 my21ke007。获取 1000个免费 Excel模板福利！

更多技巧， www.excelbook.cn

欢迎加入 零售创新 知识星球，知识星球主要以数据分析、报告分享、数据工具讨论为主；

你将获得：

1、价值上万元的专业的PPT报告模板。

2、专业案例分析和解读笔记。

3、实用的Excel、Word、PPT技巧。

4、VIP讨论群，共享资源。

5、优惠的会员商品。

6、一次付费只需129元，即可下载本站文章涉及的文件和软件。

文章版权声明 1、本网站名称：Excelbook
2、本站永久网址：http://www.excelbook.cn
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长王小琥进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报。
6、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

二维码

从零掌握正则表达式！

< <上一篇

小众软件，系统优化实用工具箱 | Dism++！

下一篇>>