mysql中从字段中URL提取域名信息
日期:2010年5月13日 作者:
假设你有一字段dm记载了一个url,为了更好的优化模糊查询速度或统计速度,在数据表原有的结构上添加3个字段,区分为
`sdm` varchar(64) NOT NULL, #subdomain记载子域名,如:123456.user.qzone.qq.com `tdm` varchar(32) NOT NULL, #topdomain记载一级域名,如:qq.com `rdm` varchar(8) NOT NULL, #rootdomain记载根域,如:com
操作顺序
# 1、为表添加字段ALTER TABLE `tablename` ADD `sdm` varchar(64) NOT NULL, ADD `tdm` varchar(32) NOT NULL, ADD `rdm` varchar(8) NOT NULL;
# 2、提取url中的域名信息
UPDATE `tablename` SET `sdm`=SUBSTRING_INDEX(SUBSTRING_INDEX(SUBSTRING_INDEX(`dm`, '/', 3), '/', -1) ,':',1);
# 3、提取域名中的根域UPDATE `tablename` SET `rdm`=(IF(`sdm` REGEXP '(comtelmobinetorgasiametvbizccnameinfo)(\\.[a-zA-Z]{2})$', SUBSTRING_INDEX(`sdm`, '.', -2), IF(`sdm` REGEXP '([a-zA-Z]{2,4})$', SUBSTRING_INDEX(`sdm`, '.', -1), '')));
# 4、依据子域名和根域取一级域名
UPDATE `tablename` SET `tdm`=CONCAT(SUBSTRING_INDEX(TRIM(TRAILING `rdm` FROM `sdm`), '.', -2), `rdm`) ;
执行结果:影响的数据栏: 126978时间: 7.172ms
(出处:https://www.yqdown.com/)
上一篇:详解SQL Server的版本区别及筛选
下一篇:MySQL的数据类型和建库战略详解
相关文章