- 改变文档的编码
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
加上上面的三行之后就可以正常的显示或使用中文。
- os.walk( top )
os.walk() 方法用于通过在目录树中游走输出在目录中的文件名,向上或者向下。
os.walk() 方法是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目录方面的事情。
top – 是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。
- root 所指的是当前正在遍历的这个文件夹的本身的地址
- dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
- files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)
- os.path.splitext()
分离文件名与扩展名,返回结果是一个二元组 ('文件名','扩展名')
#!/usr/bin/python
#coding:utf-8
import re
import os
from bs4 import BeautifulSoup
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
file=['a.http','b.txt','c.cc','d.dd.http',];
for f in file:
a = os.path.splitext(f)
print a
print a[0]
print a[1]
print '###################'
for f in file:
if os.path.splitext(f)[-1]=='.http':
print f