Python2.7,处理csv文件时,把英文逗号替换成中文逗号之后就会乱码,title变量会乱码,可是content就不会,他们都是str类型,麻烦大家,这是为啥??def main():
#初始化数据
caiji_path = 'E:/content/01_caiji' #初始文件路径
file_list = os.listdir(caiji_path) #文件名列表
#根据列表处理文档
for file_name in file_list:
abstract = ''
file_path = os.path.join(caiji_path, file_name) #拼接出完整文件路径
try:
with open(file_path, 'r') as f:
title = file_name[:-4] #title
print '获得title:', title.decode('gbk')
content = f.readline()
content = f.readline() #正文,暂时用最笨的方法,两次readline输出第二行的正文,第一行是标题。
print '获得content:......'
#字符串替换:csv使用 英文逗号 作为分隔符,要把文档中的 英文逗号 替换成 中文逗号。
title = title.replace(',', ',')
content = content.replace(',', ',')
print title#.decode('gbk')#.encode('gbk') # title 如果不替换逗号,title会正常显示,替换之后就出现乱码,decode、encode也不行
print content # content 则显示正常
except:
print sys.exc_info()[0], sys.exc_info()[1]