MySQL如何从不固定位置提取字符串元素详解

(编辑:jimmy 日期: 2025/1/10 浏览:2)

前言

备注:测试数据库版本为MySQL 8.0

测试数据:

create table zqs(id int,str varchar(1000));

insert into zqs(id,str) values (1,'【京东】abc【中国电信】');
insert into zqs(id,str) values (1,'【京东】abc【中国电信】def');
insert into zqs(id,str) values (1,'****【京东】abc【中国电信】def');
insert into zqs(id,str) values (1,'****【京东】abc');
insert into zqs(id,str) values (1,'【京东】abc【中国电信】【中国联通】');

一.需求

经常遇到短信类似的需求,需要提取短信的标记信息,但是可能会存在多个短信标记

此例假设最多有3个标签,需要输出如下:

mysql> select * from zqs;
±-----±----------------------------------------------------+
| id | str |
±-----±----------------------------------------------------+
| 1 | 【京东】abc【中国电信】 |
| 1 | 【京东】abc【中国电信】def |
| 1 | ****【京东】abc【中国电信】def |
| 1 | ****【京东】abc |
| 1 | 【京东】abc【中国电信】【中国联通】 |
±-----±----------------------------------------------------+

要求输出如下:

±-------------±-------------------±-------------------+
| first_val | first_va2 | first_va3 |
±-------------±-------------------±-------------------+
| 【京东】 | 【中国电信】 | |
| 【京东】 | 【中国电信】 | |
| 【京东】 | 【中国电信】 | |
| 【京东】 | | |
| 【京东】 | 【中国电信】 | 【中国联通】 |
±-------------±-------------------±-------------------+

二.解决方案

Oracle 字符串截取函数 substr和instr配合使用即可,但是MySQL的instr函数是弱于Oracle的instr函数。

此时需要借助MySQL的正则表达式 regexp_instr函数以及substr函数配合

select substr(str,
   regexp_instr(str,'【',1,1),
   regexp_instr(str,'】',1,1) - regexp_instr(str,'【',1,1) + 1 ) first_val, 
  substr(str,
   regexp_instr(str,'【',1,2),
   regexp_instr(str,'】',1,2) - regexp_instr(str,'【',1,2) + 1) first_va2, 
  substr(str,
   regexp_instr(str,'【',1,3),
   regexp_instr(str,'】',1,3) - regexp_instr(str,'【',1,3) + 1) first_va3
 from zqs;

测试记录:

mysql> select substr(str,
 ->   regexp_instr(str,'【',1,1),
 ->   regexp_instr(str,'】',1,1) - regexp_instr(str,'【',1,1) + 1 ) first_val,
 ->   substr(str,
 ->   regexp_instr(str,'【',1,2),
 ->   regexp_instr(str,'】',1,2) - regexp_instr(str,'【',1,2) + 1) first_va2,
 ->   substr(str,
 ->   regexp_instr(str,'【',1,3),
 ->   regexp_instr(str,'】',1,3) - regexp_instr(str,'【',1,3) + 1) first_va3
 -> from zqs;
+--------------+--------------------+--------------------+
| first_val | first_va2   | first_va3   |
+--------------+--------------------+--------------------+
| 【京东】  | 【中国电信】  |     |
| 【京东】  | 【中国电信】  |     |
| 【京东】  | 【中国电信】  |     |
| 【京东】  |     |     |
| 【京东】  | 【中国电信】  | 【中国联通】  |
+--------------+--------------------+--------------------+
5 rows in set (0.00 sec)

总结