python怎么去掉视频字幕_去除下载电影和电视剧文件名中的多余字符[python实现]...

#!\usr\bin\env python

# -*- coding: utf-8 -*-

# Author: 吴徐平

# FileName: RefineFileName.py

# Function:

# 下载的电影电视文件名太长,

# 常常含有多余的字符,如'中英双字幕',

# 可以使用本Python代码去掉

# Using python 2.7.X,win xp sp3

import sys

import os

import re

# 文件夹目录列表

FileDirectoryList=[\

u"E:\\电视电影\\都市侠盗.Leverage",\

u"E:\\电视电影\\犯罪心理.Criminal.Minds",\

u"E:\\电视电影\\海军罪案调查处.NCIS",\

u"E:\\电视电影\\警察世家.Blue.Bloods"\

]

#文件名开头处是否需要添加的字符串

#不需要添加字符时,留空(或空白)字符来表示

AddStringList=[\

u'Leverage',\

u'Criminal.Minds',\

u'NCIS.',\

u'Blue.Bloods.'

]

# 文件名中必须去掉的字符

MustReplaceStringList=[\

u'都市侠盗',\

u'犯罪心理',\

u'海军罪案调查处',\

u'警察世家',\

u'人人影视',\

u'SFiles',\

u'YYeTs',\

]

# 去掉所有不必要的字符

NewString=u'';

# 自定义重命名文件的函数

def RenameFileName(OldFileName,NewFileName):

oldpath,oldfn = os.path.split(OldFileName)

newpath,newfn = os.path.split(NewFileName)

print(oldpath.encode('ascii','ignore'))

os.rename(OldFileName, NewFileName)

#print (oldfn.encode('ascii','ignore')+' --> '+newfn.encode('ascii','ignore'))

#正则表达式替换,最多一次,忽略大小写

def StringRegexReplace(pattern,repl,string):

return re.sub(pattern, repl, string, count=1, flags=re.I)

# 循环#硬盘的电影电视剧所有目录下的文件

for FileDirectory in FileDirectoryList:

FileNamesList=os.listdir(FileDirectory)

# 循环重新命名文件

for filenamei in FileNamesList:

# 首先去掉文件名中的空格字符

RefinedFileName=filenamei.replace(u' ',NewString)

# 循环必须去掉的文件名列表

for MustReplaceString in MustReplaceStringList:

RefinedFileName=RefinedFileName.replace(MustReplaceString,NewString)

#去掉录制信息

RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*rip(?=[\.\-_])','',RefinedFileName)

RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])xvi[^.]*(?=[\.\-_])','',RefinedFileName)

#去掉分辨率

RefinedFileName=StringRegexReplace('\d{1,4}X\d{1,4}','',RefinedFileName)

#去掉[*]里面的所有内容

RefinedFileName=StringRegexReplace(u'\[.*\]','',RefinedFileName)

#去掉网址

RefinedFileName=StringRegexReplace(u'www\..*\.((com)|(net)|(cn)|(org))','',RefinedFileName)

#去掉字幕(组)的字样

RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*字幕组?','',RefinedFileName)

#去掉出品和作品字样

RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*[出作]品','',RefinedFileName)

#去掉开头的点.下划线_连接符-等

RefinedFileName=StringRegexReplace(u'^[._\-]','',RefinedFileName)

# 经常出现两个点以上,直接替换成一个点

RefinedFileName=RefinedFileName.replace(u'...',u'.')

RefinedFileName=RefinedFileName.replace(u'..',u'.')

# 可以重新命名了

OldFileName=os.path.join(FileDirectory,filenamei)

NewFileName=os.path.join(FileDirectory,RefinedFileName)

RenameFileName(OldFileName,NewFileName)

####下面的代码在文件头添加字符串

#判断是否已经添加了字符串

def HasAddString(AddString0,FileNameString0):

if (len(AddString0.strip())<1):#AddString0为空字符不需要再添加任何字符了

print('Empty AddString,No need to add to : '+ FileNameString0.encode('ascii','ignore'))

return True

else:

AddString=AddString0.strip().lower()

FileNameString=FileNameString0.strip().lower()

if(len(FileNameString)<=len(AddString)):

return False

else:

if(FileNameString[0:(len(AddString)-1)]==AddString[0:(len(AddString)-1)]):

return True

else:

return False

DirCounter=0;

# 循环#硬盘的电影电视剧所有目录下的文件

for FileDirectory in FileDirectoryList:

FileNamesList=os.listdir(FileDirectory)

AddString =AddStringList[DirCounter]

DirCounter=DirCounter+1

# 循环重新命名文件

for filenamei in FileNamesList:

#已经加过的文件名不再添加字符了

if HasAddString(AddString,filenamei):

print(filenamei.encode('ascii','ignore')+' : ALready Added Header String!')

else:

# 首先连接字符串

RefinedFileName=AddString+filenamei

# 可以重新命名了

OldFileName=os.path.join(FileDirectory,filenamei)

NewFileName=os.path.join(FileDirectory,RefinedFileName)

RenameFileName(OldFileName,NewFileName)

print(filenamei.encode('ascii','ignore')+' : Add Header String, OK!')

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值