因前端没有验证手机号的规则,后端数据处理时剔除掉不规则的手机号
例如:13000000000、14000000000、15011111111等
目前规则是前三位符合中国手机号的规则。
后8位不为同一数字。
hive sql
SELECT phone_number
FROM your_table
WHERE phone_number RLIKE '^((13[0-9])|(14[0-9])|(15[0-35-9])|(16[2567])|(17[0-8])|(18[0-9])|(19[89]))\\d{8}$'
AND NOT phone_number RLIKE '(\\d)\\1{7}';
在上述查询中,"your_table" 是存储手机号码的表名,"phone_number" 是存储手机号码的列名。
^ 和 $ 表示匹配字符串的开头和结尾。