SQL里的正则表达式!
SQL语句还可以搭配正则表达式作为查询条件,很是有用。
REGEXP_LIKE(匹配)
REGEXP_INSTR (包含)
REGEXP_REPLACE(替换)
REGEXP_SUBSTR(提取)
表 1:定位元字符
| 元字符 |
说明 |
| ^ |
使表达式定位至一行的开头 |
| $ |
使表达式定位至一行的末尾 |
表 2:量词或重复操作符
| 量词 |
说明 |
| * |
匹配 0 次或更多次 |
| ? |
匹配 0 次或 1 次 |
| + |
匹配 1 次或更多次 |
| {m} |
正好匹配 m 次 |
| {m,} |
至少匹配 m 次 |
| {m, n} |
至少匹配 m 次但不超过 n 次 |
表 3:预定义的 POSIX 字符类
| 字符类 |
说明 |
| [:alpha:] |
字母字符 |
| [:lower:] |
小写字母字符 |
| [:upper:] |
大写字母字符 |
| [:digit:] |
数字 |
| [:alnum:] |
字母数字字符 |
| [:space:] |
空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符 |
| [:punct:] |
标点字符 |
| [:cntrl:] |
控制字符(禁止打印) |
| [:print:] |
可打印字符 |
表 4:表达式的替换匹配和分组
| 元字符 |
说明 |
| | |
替换 |
分隔替换选项,通常与分组操作符 () 一起使用 |
| ( ) |
分组 |
将子表达式分组为一个替换单元、量词单元或后向引用单元(参见“后向引用”部分) |
| [char] |
字符列表 |
表示一个字符列表;一个字符列表中的大多数元字符(除字符类、^ 和 - 元字符之外)被理解为文字 |
表 5:REGEXP_LIKE 操作符
| 语法 |
说明 |
REGEXP_LIKE(source_string, pattern
[, match_parameter]) |
source_string 支持字符数据类型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 参数是正则表达式的另一个名称。match_parameter 允许可选的参数(如处理换行符、保留多行格式化以及提供对区分大小写的控制)。 |
表 6:REGEXP_INSTR 函数
| 语法 |
说明 |
REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]]) |
该函数查找 pattern ,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的 start_position。 occurrence 参数默认为 1,除非您指定您要查找接下来出现的一个模式。return_option 的默认值为 0,它返回该模式的起始位置;值为 1 则返回符合匹配条件的下一个字符的起始位置。 |
表 7: 5 位数字加 4 位邮政编码表达式的说明
| 语法 |
说明 |
|
必须匹配的空白 |
| [:digit:] |
POSIX 数字类 |
| ] |
字符列表的结尾 |
| {5} |
字符列表正好重复出现 5 次 |
| ( |
子表达式的开头 |
| - |
一个文字连字符,因为它不是一个字符列表内的范围元字符 |
| [ |
字符列表的开头 |
| [:digit:] |
POSIX [:digit:]类 |
| [ |
字符列表的开头 |
| ] |
字符列表的结尾 |
| {4} |
字符列表正好重复出现 4 次 |
| ) |
结束圆括号,结束子表达式 |
| ? |
? 量词匹配分组的子表达式 0 或 1 次,从而使得 4 位代码可选 |
| $ |
定位元字符,指示行尾 |
表 8:REGEXP_SUBSTR 函数
| 语法 |
说明 |
REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]]) |
REGEXP_SUBSTR 函数返回匹配模式的子字符串。 |
表 9: REGEXP_REPLACE 函数
| 语法 |
说明 |
REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]]) |
该函数用一个指定的 replace_string 来替换匹配的模式,从而允许复杂的“搜索并替换”操作。 |
表 10:后向引用元字符
| 元字符 |
说明 |
| digit |
反斜线 |
紧跟着一个 1 到 9 之间的数字,反斜线匹配之前的用括号括起来的第 digit 个子表达式。
(注意:反斜线在正则表达式中有另一种意义,取决于上下文,它还可能表示 Escape 字符。 |
表 11:模式交换正则表达式的说明
| 正则表达式项目 |
说明 |
| ( |
第一个子表达式的开头 |
| . |
匹配除换行符之外的任意单字符 |
| * |
重复操作符,匹配之前的 . 元字符 0 到 n 次 |
| ) |
第一个子表达式的结尾;匹配结果在 1
中获取(在这个例子中,结果为 Ellen。) |
|
必须存在的空白 |
| ( |
第二个子表达式的开头 |
| . |
匹配除换行符之外的任意单个字符 |
| * |
重复操作符,匹配之前的 . 元字符 0 到 n 次 |
| ) |
第二个子表达式的结尾;匹配结果在 2
中获取(在这个例子中,结果为 Hildi。) |
|
空白 |
| ( |
第三个子表达式的开头 |
| . |
匹配除换行符之外的任意单字符 |
| * |
重复操作符,匹配之前的 . 元字符 0 到 n 次 |
| ) |
第三个子表达式的结尾;匹配结果在 3
中获取(在这个例子中,结果为 Smith。) |
表 12:社会保险号码正则表达式的说明
| 正则表达式项目 |
说明 |
| ^ |
行首字符(正则表达式在匹配之前不能有任何前导字符。) |
| ( |
开始子表达式并列出用 | 元字符分开的可替换选项 |
| [ |
字符列表的开头 |
| [:digit:] |
POSIX 数字类 |
| ] |
字符列表的结尾 |
| {3} |
字符列表正好重复出现 3 次 |
| - |
连字符 |
| [ |
字符列表的开头 |
| [:digit:] |
POSIX 数字类 |
| ] |
字符列表的结尾 |
| {2} |
字符列表正好重复出现 2 次 |
| - |
另一个连字符 |
| [ |
字符列表的开头 |
| [:digit:] |
POSIX 数字类 |
| ] |
字符列表的结尾 |
| {4} |
字符列表正好重复出现 4 次 |
| | |
替换元字符;结束第一个选项并开始下一个替换表达式 |
| [ |
字符列表的开头 |
| [:digit:] |
POSIX 数字类 |
| ] |
字符列表的结尾 |
| {9} |
字符列表正好重复出现 9 次 |
| ) |
结束圆括号,结束用于替换的子表达式组 |
| $ |
定位元字符,指示行尾;没有额外的字符能够符合模式 |
|
SELECT * FORM. tKHXX where REGEXP_LIKE(SJHM, '^[1]{1}[35]{1}[[:digit:]]{9}$'
针对这个表达式解释一下
^ 表示开始
$ 表示结束
[]内部为匹配范围
{}里的内容表时个数,有几位
手机号码的特点是以 1开头接着是3或5再加9位的数字 所以这么理解
1开头 表达式为 ^[1]{1} 意为 开始1位里包含1
3或5 表达式为 [35]{1}
9位数字结束 为: [[:digit:]]{9}$ 这里[:digit:]为特殊写法,代表为数字 再加个结束符$
如果大家有其他的方法,或者想要知道哪方面的办公技巧,下方评论哦~
学习资料见知识星球。
以上就是今天要分享的技巧,你学会了吗?若有什么问题,欢迎在下方留言。
快来试试吧,小琥 my21ke007。获取 1000个免费 Excel模板福利!
更多技巧, www.excelbook.cn
欢迎 加入 零售创新 知识星球,知识星球主要以数据分析、报告分享、数据工具讨论为主;

你将获得:
1、价值上万元的专业的PPT报告模板。
2、专业案例分析和解读笔记。
3、实用的Excel、Word、PPT技巧。
4、VIP讨论群,共享资源。
5、优惠的会员商品。
6、一次付费只需129元,即可下载本站文章涉及的文件和软件。