需求:有一个1,500,000行数据的文件,需要进行多次检索。其中每行文件为一个列表,且每行列表的首位有序
问题:使用一般的循环检索方式,非常耗时,检索速度慢。
一、基础语法
1、拆分文件的路径和文件名
如要获取的文件绝对路径为:/aaa/aaa.txt,方法如下:
import os
filePath = "/aaa/aaa.txt"
array=os.path.split(filePath)
#得到的array由两部分组成,文件路径和文件名
print "array[0]:\n",array[0]
print "array[1]:\n",array[1]
'''
结果为:
array[0]:
/aaa
array[1]:
aaa.txt
'''
或者用下面的方法:
(filePath,fileName) = os.path.split(fileOriginPath)
2、拆分文件名主文件名和扩展名
(mainName,extension) = os.path.splitext(filePath)
print "mainName:\n",mainName
print &