def configure_file(src_file):
src_f = open(src_file,'r')
dest_f = open('D:\confile.txt','a+')
filename = os.path.basename(src_file)
i = 1
index = 0
for eachline in src_f:
if(eachline.find('*** keywords ***') != -1):
break
if(eachline.find('Test Cases') < 0 and index == 0):
continue
index = 1
if (eachline.find('Test Cases') > 0):
continue
if(eachline.find(' ') == -1):
test_name = eachline.decode('utf-8').encode('gb2312')
continue
if (eachline.find('[Documentation]') != -1):
dest_f.write('8196' + '.' + filename + '.' + 'test' + str(i) + ' ')
i += 1
del_doc=eachline.replace('[Documentation]','')
exp = del_doc.strip()
exp_1 = exp.decode('utf-8').encode('gb2312')
dest_f.write(exp_1 + ' ')
dest_f.write(test_name)
src_f.close()
dest_f.close()
最近学习Python,感觉很好很强大!
从昨天中午写一个配置文件的程序到现在,原谅我是一个乌龟新手,进度很慢!
每一个自己动手写程序完成一个小小的功能,都能让我遇到很多错误,学到很多东西。我思考了一下,或许这样学习比较会有效果~
在这个程序中,除了一些小小的文件操作的问题,困扰最大的也就是编码的问题。好像这是好多新手的问题:
decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicode编码。
encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unicode编码的字符串str2转换成gb2312编码。
获得系统默认编码:
import sys
print sys.getdefaultencoding()
该段程序在英文WindowsXP上输出为:ascii
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)。这是因为在英文WindowsXP上的控制台信息输出窗口是按照ascii编码输出的(英文系统的默认编码是ascii),而上面代码中的字符串是Unicode编码的,所以输出时产生了错误。所以要加encode('gb2312')
GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换
新手上路,很是兴奋。
尤其超级感谢网上答疑解惑发布学习经验的大神们,在自学的过程中甚是福利。
好好学习。