第一次学习python.
目的:编辑python脚本文件,输出目的磁盘的文件系统名称。
语句:
#-*- coding utf-8-*- //编译器就是python2.7,经验证,此行命令在2.4版本前需要试用,至少2.7版本无所谓
import os
print os.listdir("E:")
输出结果是
Python 2.7.2 (default, Jun 12 2011, 15:08:59) [MSC v.1500 32 bit (Intel)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> ================================ RESTART ================================
>>>
['$RECYCLE.BIN', 'Pictures', 'Program Files', 'Qiyi', 'StormMedia', 'System Volume Information', 'TDDOWNLOAD', '\xd0\xd0\xca\xac\xd7\xdf\xc8\xe2.The.Walking.Dead.S02E04.Chi_Eng.Webrip.720X400-YYeTs\xc8\xcb\xc8\xcb\xd3\xb0\xca\xd3.rmvb', '\xc3\xd4\xc0\xeb\xb5\xb5\xb0\xb8']
上述是楼主E盘根目录里所有文件与文件夹,不会显示子目录。
问题1:
书中是以ubuntu的系统,原语句为:
#-*- coding utf-8-*-
import os
print os.listdir("/media/cdrom0")
区别是由于ubuntu系统与win 系统的磁盘管理造成,对于win系统只需输入"逻辑盘符:\子文件夹..."
问题2:
如上文所见输出结果中凡是英文命名文件或者文件夹均能正常显示,例如楼主E盘中得“迷离档案”文件夹就被输出为'\xc3\xd4\xc0\xeb\xb5\xb5\xb0\xb8',猜想是字符编码的问题,为求证实,可用以下语句验证
s= 迷离档案
unicode(s,"utf-8").encode("gbk")
输出结果为'\xc3\xd4\xc0\xeb\xb5\xb5\xb0\xb8',与上文所见输出相同。
utf-8是国际编码,GBK是中日韩大字符集合,目前utf-8所包含的汉字数小于GBK,简而言之,如果采用GBK编码,那么在欧美国家浏览我们的GBK编辑的文字除了英文以外应该是乱码显示。据此也可以推论楼主win下的中文也是GBK编码。
求教:
如何让python正常输出中文命名的文件夹与文件信息。求大虾教