顶部
起因
最近在看视频时,发现有些视频的文案很好,想单独剪下次来做成一个文本收藏,但是找到的字幕文件只有json格式,一打开全是英文和数字,中文很难找到,所以我决定给它转换成只有文本的srt格式。
解决过程
首先,在网上搜了一圈,找到一篇文章
【python】实现将json字幕转srt,并将繁体中文翻译为简体中文
参照这篇文章,我查看我的json文件
好吧,我的文件和他们不太相似,所以
按照文章加入[‘body’] ,然后
因为我只需要文本,不需要时间和序号,看了一些json的语法,经过稍微修改,参考文章
https://www.kancloud.cn/zxcv0000/study/917057
https://vimsky.com/examples/usage/json-load-in-python.html
最后程序如下图所示
import json
import os
file = '' # 这个变量用来保存数据
for doc in os.listdir(): # 遍历当前文件夹的所有文件
if (doc[-4:] == 'json'): # 若是json文件则进行处理
name = doc[:-5] # 提取文件名
# 将此处文件位置进行修改,加上utf-8是为了避免处理中文时报错
with open(doc, encoding='utf-8') as f:
datas = json.load(f) # 加载文件数据
for data in datas["materials"]["texts"]:
content = data['content'] # 获取字幕内容
file += content + '\n' # 加入字幕文字
with open('./{}.srt'.format(name), 'w', encoding='utf-8') as f:
f.write(file) # 将数据写入文件
注意!!!
for data in datas["materials"]["texts"]:
content = data['content'] # 获取字幕内容
在json文件中,一个嵌套一个,要找到最初的键,然后逐个代进去。我的json文件如下所示
"materials":
{
····
"texts":
[
{
····
"content": "我觉得每就是每个人和每个人",
····
}
]
····
}
下面这段代码本身就包含自动关闭文件了,所以后面不用加上f.close()
with open() as f:
运行成功
我也照着那篇文章,将我自己的程序打包成为可执行文件附上来
https://download.csdn.net/download/qq_36262908/85163718