python获取字符串第一个字母,python-匹配第一个字母数字字符的跳过(| An?)

我有一个艺术家,专辑和曲目的列表,我想使用它们各自名称的首字母进行排序.当我想忽略“ The”,“ A”,“ An”和其他各种非字母数字字符时(与您交谈“ Weird Al” Yankovic和[dialog]),问题就来了. Django有一个不错的开始’^(An?| The)’,但我想忽略这些以及其他一些我选择的东西.

我在Django中使用带有utf8_bin排序规则的MySQL数据库执行此操作.

编辑

好吧,我的错是没有提到这个,但是我正在访问的数据库只是准备好了.它是由Amarok创建和维护的,没有很多问题,我无法更改它.话虽如此,艺术家表中的The Chemical Brothers列为The Chemical Brothers,所以我想我留在这里了.这可能会很慢,但这对我来说不是什么大问题,因为它是一个个人项目.

解决方法:

您所要的可能不是您所需要的.您可能不想仅按首字母排序.如果第一个字母相同,则通常还需要查看第二个字母,依此类推.这将导致在按艺术家排序时,同一艺术家的所有歌曲都被分组在一起.

更新的答案

您说您不允许更改数据库.然后,您可以使用TRIM(LEADING ... FROM ...)去除不感兴趣的单词,但是请注意,这将很慢,因为查询将无法在列上使用索引.

SELECT *

FROM song

WHERE SUBSTRING(TRIM(LEADING 'The ' FROM TRIM(LEADING 'A ' FROM title)), 1, 1) = 'B'

ORDER BY TRIM(LEADING 'The ' FROM TRIM(LEADING 'A ' FROM title))

结果:

'The Bar' -- "The" is ignored when sorting.

'Baz A'

测试数据:

CREATE TABLE song (title NVARCHAR(100) NOT NULL);

INSERT INTO song (title) VALUES

('The Bar'),

('Baz A'),

('Foo'),

('Qux'),

('A Quux');

原始答案

另请注意,如果您对某列的函数进行ORDER BY,则当您有很多记录时,它将非常缓慢,因为该列的索引无法使用.相反,您应该存储另一列,在其中删除所有无用的单词(the,an等),并按该列排序.您可以在插入行时从应用程序将其插入该列,也可以在数据库中使用触发器.

标签:python,mysql,regex

来源: https://codeday.me/bug/20191210/2099515.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值