1、collections模块
collections模块是一个很有用的模块,目前用到了里面的Counter与deque
1.Counter()实现计数功能
#coding:utf-8
import collections
a = ["a","b","a","a","b","c","d"]
b = collections.Counter(a).most_common(6)
print b
>>>[('a', 3), ('b', 2), ('c', 1), ('d', 1)]
返回的是list,内部是tuple,每个tuple为字符与字符出现的次数
2.deque()双端队列结构,提供两端插入与删除
#coding:utf-8
import collections
a=collections.deque(maxlen=5)
for i in range(5):
a.append(i)
print a
a.append(7)
print a
>>>
deque([0, 1, 2, 3, 4], maxlen=5)
deque([1, 2, 3, 4, 7], maxlen=5)
2.chardet模块
用于字符串的编码检测
import chardet
file = open("./lt_test","r")
texts = file.readlines()
for text in texts:
print chardet.detect(text)
file.close()
>>>
{'confidence': 0.99, 'language': '', 'encoding': 'utf-8'}
{'confidence': 0.7525, 'language': '', 'encoding': 'utf-8'}
#说明文本是以utf-8格式编码的
3、map、filter、reduce函数
map:
#coding:utf-8
a = [1,2,3,4,5]
def add_1(a):
return a+1
print map(add_1,a)
#>>>
#[2, 3, 4, 5, 6]
# map(f,list)是 Python 内置的高阶函数,它接收一个函数 f 和一个 list,
# 并通过把函数 f 依次作用在 list 的每个元素上,得到一个新的 list 并返回
#注意:map()函数不改变原有的 list,而是返回一个新的 list。
filter
#coding:utf-8
def ifLargerThen5(x):
return x>5
a = [4,5,6,7,8]
print filter(ifLargerThen5,a)
#>>>
#[6,7,8]
# filter()函数接收一个函数 f 和一个list,
# 这个函数 f 的作用是对每个元素进行判断,返回 True或 False,
# filter()根据判断结果自动过滤掉不符合条件的元素,返回由符合条件元素组成的新list。
reduce
#coding:utf-8
def add_1(x,y):
return x+y
a = [1,2,3,4,5]
print reduce(add_1,a)
print reduce(add_1,a,100)
# reduce(f,list,init=None)
# 函数f必须接收两个参数,reduce()对list的每个元素反复调用函数f,并返回最终结果值
# 如果给定init,则第一次计算 f(list[0],init)作为第一次计算的返回值
# 如果不给定init ,则第一次计算f(list[0],list[1])作为第一次计算的返回值
4、lambda函数
#coding:utf-8
a = lambda x:x+1
print a(1)
print a(2)
# >>>
# 2
# 3
# x为入口参数,x+1为函数体
# a = lambda x:x+1 相当于
# def add_1(x):
# return x+1
b = lambda x,y:x*y
print b(2,3)
# >>>
# 6
#x,y为函数的入口参数,函数的返回值为x*y
5、next():返回迭代器的下一个项目
#coding:utf-8
it = iter([1,2,3,4,5])
print it
# print next(it)
for i in range(5):
print next(it)
# next() 返回迭代器的下一个项目。
# >>>
# <listiterator object at 0x1017512d0>
# 1
# 2
# 3
# 4
# 5
6、zip()与zip(*)
#coding:utf-8
a = [[['ab','cd'],'1'],[['ef','gh'],'2'],[['ij','kl'],'3']]
b = list(zip(*a)) #这里,zip(*)操作是unzip,将list的内容看做是zip()函数处理过的,进行反zip()操作。
b1 = zip(*a)
print(b)
print(b1)
#注意Python2和python3在这里Print是不一样的
python3:
[(['ab', 'cd'], ['ef', 'gh'], ['ij', 'kl']), ('1', '2', '3')]
<zip object at 0x110005348>
python2:
[(['ab', 'cd'], ['ef', 'gh'], ['ij', 'kl']), ('1', '2', '3')]
[(['ab', 'cd'], ['ef', 'gh'], ['ij', 'kl']), ('1', '2', '3')]