Mysql我是怎么随机截取字符数组里的字符串并且一一对应

场景:临近年底,各个App都会有个人年度账单,项目里为了图快,以及节省各个系统模块之间的接口联调。直接人工统计数据(😳😳😳😳😳😳😳😳😳😳😳😳😳😳),构造账单数据JSON。

话不多说,老夫拿起键盘就是干。

无独有偶,数据按部就班的由其他各个系统小组提供,但是有些数据是随机生成的一些描述性的文本,而该文本从固定的文本数组而来。前端展示效果又要将随机文本拆成几个部分来。

正常的sql拼接成json还方便。

1
2
CONCAT('\"app\":{\"time\":\"', DATE_FORMAT(time, "%Y-%m-%d %T"), '\",\"days\":', days, 
case when typeTime is null then '' else CONCAT(',\"typeTime\":\"', DATE_FORMAT(typeTime, "%Y-%m-%d %T"), '\"') end,'}')

随机文本来了

学富五车:再美的气质,也掩盖不了你才华本质
足智多谋:脑力使用积极分子,非你莫属
仗义执言:你的见解,面面俱到,深入人心
火眼金睛:独特的洞察力,总能获悉一切
见多识广:最美的阅历,就是沿路的风景
责任担当:先天下之忧而忧,后天下之乐而乐

从上面可以看的出,它们之间一一对应的。

唯独那些随机文本着实思考片刻。来,我们层层剖析它。

截取文本

mysql中怎么从数组中取随机的文本,参考substring_index函数。分为两步走,第一步先去倒数开始往前数倒数几位,第二步再从新的数组中取第一位。

1
substring_index(substring_index(array, '符合间隔', -n), '符合间隔', 1)

构造随机因子

现在再看看这个随机因子怎么取,参考rand()函数。

因为取的是-1到-7之间的随机数。所以最终的效果就是如下。

1
-floor(rand()*7+1)

取随机范围内的值可以参考这个公式

1
FLOOR(start_num + RAND() * (end_num - start_num + 1))

第一次截取,每次随机

随机串截取方法有了,随机数也有了,开干。

1
2
3
4
5
select user_id, CONCAT('\"desc\": {\"label\":\"', 
substring_index(substring_index('学富五车;足智多谋;仗义执言;火眼金睛;见多识广;责任担当;乐观积极',';',-FLOOR(rand()*7+1)),';',1),'\"',
',\"description\": \"', substring_index(substring_index('再美的气质,也掩盖不了你才华本质;脑力使用积极分子,非你莫属;你的见解,面面俱到,深入人心;独特的洞察力,总能获悉一切;最美的阅历,就是沿路的风景;先天下之忧而忧,后天下之乐而乐;爱笑的你运气一定不会差',';',-FLOOR(rand()*7+1)),';',1),
'\"}'
) as report_content from data;

结果发现对不上啊,【责任担当】应该对应【先天下之忧而忧,后天下之乐而乐】,而结果出现部分对应到【再美的气质,也掩盖不了你才华本质】img

第二次截取,先一次随机两次用

这次考虑到上回我们是把随机因子放在每个字段sql里,所以每次都执行了2次,生成是随机因子就不一样了,截取的结果就对应不上,那,我们先在子查询里先把随机因子生成后,再在外层用这个随机因子这下应该不一样了把。

1
2
3
4
5
select temp.user_id, CONCAT('\"desc\": {\"label\":\"', 
substring_index(substring_index('学富五车;足智多谋;仗义执言;火眼金睛;见多识广;责任担当;乐观积极',';',temp.desc_index),';',1),'\"',
',\"description\": \"', substring_index(substring_index('再美的气质,也掩盖不了你才华本质;脑力使用积极分子,非你莫属;你的见解,面面俱到,深入人心;独特的洞察力,总能获悉一切;最美的阅历,就是沿路的风景;先天下之忧而忧,后天下之乐而乐;爱笑的你运气一定不会差',';',temp.desc_index),';',1),
'\"}'
) as report_content from (select user_id, -FLOOR(rand()*7+1) as desc_index from data) temp

吐血的图片在查找中,从开头看就看的出来,对应不上啦,前几个就前部对应【爱笑的你运气一定不会差】,爱笑的我,运气就是这么差。

image-20190117145010072

改变下语句把随机因子打印出来

1
2
3
4
5
select temp.user_id, desc_index, CONCAT(desc_index, '\"desc\": {\"label\":\"', 
substring_index(substring_index('学富五车;足智多谋;仗义执言;火眼金睛;见多识广;责任担当;乐观积极',';',temp.desc_index),';',1),'\"',
',\"description\": \"', substring_index(substring_index('再美的气质,也掩盖不了你才华本质;脑力使用积极分子,非你莫属;你的见解,面面俱到,深入人心;独特的洞察力,总能获悉一切;最美的阅历,就是沿路的风景;先天下之忧而忧,后天下之乐而乐;爱笑的你运气一定不会差',';',temp.desc_index),';',1),
'\"}'
) as report_content from (select user_id, -FLOOR(rand()*7+1) as desc_index from data) temp

WTF,随机因子,明明在子查询都生成了,为毛还是不一样。

image-20190117145539095

来自官方大佬的截取

本想在子查询中使用rand()把随机因子可以搞出来,哪成想,在外层的查询时rand()又重算了一遍。

一顿参考一顿找资料,偶然间发现了问题所在

Mysql尽然有这样的bug

2017年有个哥们提了这样的一个issue,就是上面的链接。

里面说了一些情况,在mysql5.6里,随机数是一样的,5.7里随机数不一样。如果子查询里不使用表,随机数也是一样。刚刚好mysql就是5.7,刚刚好中招了。

image-20190117151229364

根据ISSUE作者和Roy Lyseng的建议,我用limit,没想到,尽然阔以啦,老泪纵横啊。

还是老外好,成功的解决方案,也会在issue里说明下的。

改造后的最终样子。

1
2
3
4
5
select temp.user_id, desc_index, CONCAT(desc_index, '\"desc\": {\"label\":\"', 
substring_index(substring_index('学富五车;足智多谋;仗义执言;火眼金睛;见多识广;责任担当;乐观积极',';',temp.desc_index),';',1),'\"',
',\"description\": \"', substring_index(substring_index('再美的气质,也掩盖不了你才华本质;脑力使用积极分子,非你莫属;你的见解,面面俱到,深入人心;独特的洞察力,总能获悉一切;最美的阅历,就是沿路的风景;先天下之忧而忧,后天下之乐而乐;爱笑的你运气一定不会差',';',temp.desc_index),';',1),
'\"}'
) as report_content from (select user_id, -FLOOR(rand()*7+1) as desc_index from data limit 100000) temp

image-20190117151435160

Damon wechat
同步在个人微信公众号
坚持原创技术分享,您的支持将鼓励我继续创作!