本博用于个人python学习杂记,遇到问题会将解决方法和心得写下来。
2015/4/23:python读取twitter数据挖掘文件后处理。
#coding=utf-8
name = "twitter数据挖掘片段.txt".decode("utf-8")
a = open(name,"r")
str1 = a.readline()
print str1 #直接print str1 是没问题的
b = str1.split(',')
print str(b).decode('string_escape')#由于直接print b 会把文字显示成类似这种:\xe3\x81\xa6\xe3\x82\x93\xe3\x81\x98\xe3,所以使用str(b).decode('string_escape')来解决编码问题
a.close()