Python文件处理练习–中英文分离
问题:
对51voa上的中英文对照文本进行中英文分离
例如
华盛顿总统将感恩节定为全国性节日
问题分析:
源文件是纯文本,每一行以回车符分隔,是一个中文或英文块,其中中文文本仅包含中文标点,英文文本仅包含英文标点,所以可以通过检查行中是否包括中、英文标点判断是中文或英文块,达到分离中英文的目的。
常规版本
#deal with voa
def dealVoa(orgtxts,Eng,Chn):
fi = open(orgtxts,'r',encoding='utf-8')
foe = open(Eng,'w')
foc = open(Chn,'w')
elist = ',.'
clist = ',。'
for line in fi