当想要把电影或者视频的音频转成mp3在手机或者设备上听的时候,或者是用来练英语听力的时候,那么,就需要把相关的srt字幕文件,转换成lrc的歌词文件。
搜了很多网上的,都没有这个代码,只有lrc转srt的。
没办法,只好自己写一个。
首先看下srt字幕文件的格式,因为我们是要把srt格式的文件,转换成lrc的
1
00:00:02,200 --> 00:00:04,120
Well, I have a question.
2
00:00:04,120 --> 00:00:05,760
I guess I'd like to know
3
00:00:05,760 --> 00:00:06,960
a little bit more about why
4
00:00:06,960 --> 00:00:08,760
you specifically chose
srt大概就是上面这种格式。
再来看下lrc歌词文件的格式
[00:02.20]Well, I have a question.
[00:04.12]I guess I'd like to know
[00:05.76]a little bit more about why
[00:06.96]you specifically chose
lrc就是上面的这种格式。
这里要提前说一下转换成lrc途中遇到的需要注意的事,lrc的时间戳是只在分钟内的,所以小时要转换成分钟数,添加到分钟数里面。
也就是lrc的时间戳只精确到分钟,这里要注意这一点。
最后上具体的转换的python代码
代码使用方式是用文件夹转换的,即srt字幕放在文件夹里,参数是传入文件夹的路径,然后在文件夹的外面新建"字幕转lrc"文件夹,批量输出转换的lrc歌词文件。
这里先给出这个代码文件的接口
#srt字幕所在的文件夹,这里是文件夹转换,方便有多个字幕的时候,都放在这个文件夹,可以批量转换。
dir_path=""
zimu_to_lrc_get_file(dir_path)
import os
from natsort import ns, natsorted
import chardet
#获取编码格式,没有chardet库要安装
def get_code(filepath):
with open(filepath,'rb') as f:
return chardet.detect(f.read())['encoding']
#列表字符串拼接成字符
def list_to_str2(out_list):
stryy = ""
for ll in out_list:
stryy = stryy + str(ll) + "\n"
return stryy
#写入文本到文件
def write_file(filename,str1):
print(f'写入文件')
fo = open(filename, "w+", encoding='utf-8')
fo.write(str1)
fo.close()
#顺序读取
def read_content_order22_blank(filename):
print(f'开头读取文本,顺序')
fk3 = open(filename, "r", encoding=get_code(filename))
grafk = fk3.readlines()
fk3.close()
aaby=[]
#去掉换行符
print(f'开头的去掉换行符')
for ssij in grafk:
ssij = str(ssij).replace("\n", "")
if len(ssij)>0:
aaby.append(ssij)
return aaby
def tran_format(strtime):
strtime=str(strtime).replace(" ","")
t1dplace=str(strtime).find(",")
lasnum=strtime[int(t1dplace)+1:int(t1dplace)+3]
purenum=strtime[0:t1dplace]
timelistaa=purenum.split(":")
if str(timelistaa[0])!="00":
dshu3=str(int(timelistaa[0])*60+int(timelistaa[1]))
else:
dshu3=timelistaa[1]
dshu2=timelistaa[2]
outtime=f"[{dshu3}:{dshu2}.{lasnum}]"
return outtime
def zimu_to_lrc_get_file(dir_path):
files = os.listdir(dir_path)
files = natsorted(files, alg=ns.PATH)
dirname = os.path.dirname(dir_path)
outdir = dirname + "/字幕转lrc/"
if not os.path.exists(f"{outdir}"):
print("输出文件夹不存在,帮你自动创建好了")
print("==================================")
os.mkdir(f"{outdir}")
exte_type = '.srt'
for tt in files:
exte_nam = os.path.splitext(tt)[1]
exte_nam0 = os.path.splitext(tt)[0]
if exte_nam:
if str(exte_type) == str(exte_nam) :
aab = dir_path + '/' + tt
aab2 = dir_path + '/' + str(exte_nam0)+ ".txt"
outaab=outdir+str(exte_nam0)+ ".lrc"
os.rename(aab,aab2)
filelist=read_content_order22_blank(aab2)
wb=""
outlist=[]
for kk in filelist:
if not str(kk).isdigit():
if str(kk).find("-->")!=-1:
timenam=kk.split("-->")
time=tran_format(timenam[0])
wb=wb+time
else:
wb=wb+str(kk)
else:
if len(str(wb))>0:
outlist.append(wb)
wb = ""
if len(str(wb)) > 0:
outlist.append(wb)
wb = ""
stryy=list_to_str2(outlist)
write_file(outaab, stryy)
os.rename(aab2, aab)
if __name__ == '__main__':
#srt字幕所在的文件夹,这里是文件夹转换,方便有多个字幕的时候,都放在这个文件夹,可以批量转换。
dir_path=""
zimu_to_lrc_get_file(dir_path)
pass