python进阶——如何在列表、字典和集合中根据条件筛选数据

python数据结构知识复习:

Python包含6中内建的序列,即列表、元组、字符串、Unicode字符串、buffer对象和 xrange 对象。序列都可以进行的操作包括索引,切片,加,乘,检查成员。此外,Python已经内置确定序列的长度以及确定最大和最小的元素的方法。

python中的数据结构主要有:

  • 元组tuple
  • 列表 List
  • 字典 dict
  • 集合set
1.列表List

列表是最常用的Python数据类型,列表的数据项不需要具有相同的类型。列表中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。
对列表的操作:

创建列表
list1 = ['physics', 'chemistry', 1997, 2000]
list2 = [1, 2, 3, 4, 5 ]
list3 = ["a", "b", "c", "d"]
list4=[randint(-10,10) for _ in range(10)]#_表示一个零时变量,for后面这部分其实就是表示生成是个元素,每次是从-10到10的一个随机整数作为这个list的元素。
list5=[x for x in range(1,15,3)]

运行结果

['physics', 'chemistry', 1997, 2000]
[1, 2, 3, 4, 5]
["a", "b", "c", "d"]
[-7, -6, 4, 1, -3, 4, 9, -8, -9, -8]
[1, 4, 7, 10, 13]
访问列表中元素的值
list1 = [1, 2, 3, 4, 5, 6, 7 ]
print(list1[0])
print(list1[1:5])

运行结果:

1
[2, 3, 4, 5]
更新列表

可以通过列表的索引直接修改元素,也可以通过append()方法来给列表添加元素

list = ['physics', 'chemistry', 1997, 2000]
list[2]='3000'#直接修改列表元素
list.append('new element')
list

运行结果:

['physics', 'chemistry', ‘3000’, 2000, 'new element']
删除列表元素
list1 = ['physics', 'chemistry', 1997, 2000]
del list1[2]#删除第三个元素
list1

运行结果

['physics', 'chemistry', 2000]

列表操作包含以下函数:
1、cmp(list1, list2):比较两个列表的元素
2、len(list):列表元素个数
3、max(list):返回列表元素最大值
4、min(list):返回列表元素最小值
5、list(seq):将元组转换为列表
列表操作包含以下方法:
1、list.append(obj):在列表末尾添加新的对象
2、list.count(obj):统计某个元素在列表中出现的次数
3、list.extend(seq):在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)
4、list.index(obj):从列表中找出某个值第一个匹配项的索引位置
5、list.insert(index, obj):将对象插入列表
6、list.pop(obj=list[-1]):移除列表中的一个元素(默认最后一个元素),并且返回该元素的值
7、list.remove(obj):移除列表中某个值的第一个匹配项
8、list.reverse():反向列表中元素
9、list.sort([func]):对原列表进行排序

2、元组

元组的学习一般是和列表做对必学习的,元组的格式相比于列表变成了小括号。
学习元组主要注意一下问题:

  1. 元组不可变性

a = (1,2)
a[0] = 2 会报错TypeError: ‘tuple’ object does not support item assignment。
a = (1,2,[1,2,3])
a [2][1] = 0 是可以的

元组的不可变性是指元组的元素指向的数据不可变。所以tuple不变的是指向,指向什么就一直是什么,不能改变。

  1. 元组的相加
a=(1,2,3,4)
id(a)
b=(3,4,5)
a=a+b
id(a)
a

运行结果:

120091534616
120120326072
(1, 2, 3, 4, 5, 3, 4, 5)

这里两次输出a的id不相同,说明他们是不同的对象,刚开始a=(1,2,3,4),后面讲a+b组合的一个元组重新赋值给a,不是a变了,原来的那个元组也没有变,只是没有了引用,最后会被当做垃圾回收。

  1. 元组的删除

tup = (1,2,3,4);
del tup[0];
此时会报错TypeError: ‘tuple’ object doesn’t support item deletion

  1. 元组访问及切片

a = (1,2,[3,4])
a[0]指向1,a[2][1]指向4
a[:1]指向一个子元组(1,2)

  1. 元组操作
    cmp(tuple1, tuple2):比较两个元组元素。
    len(tuple):计算元组元素个数。
    max(tuple):返回元组中元素最大值。
    min(tuple):返回元组中元素最小值。
    tuple(seq):将列表转换为元组。

cmp(),len(),min(),max()都是序列的内置函数,tuple也是序列,所以可以用内置函数操作。tuple()是工厂函数。

3.字典

文章1
文章2

上面这两边文章写得比较全面。

4.集合

这篇文章集合讲的很好,对于复习和学习都有帮助,可以跟着文章的代码练习一遍还是有很大的帮助。

如何在列表、字典和集合中根据条件筛选数据。

正对这个问题,提出下面三个案例:

- 过滤到列表[3,9,-1,10,20,30,-4]中的负数。

解决方案:

-列表:可以利用filter()函数列表解析两种方法

filter(function, itetable)
生成一个迭代器从这些可迭代对象元素里面从符合函数的返回值为真。iterable参数可以是一个序列,一个支持可迭代的容器,或者一个迭代器,如果function这个形参没有,那么会删除所有为false的迭代元素。这个函数等价于 (item for item in iterable if function(item)) 这个生成器表达式。或者(item for item in iterable if item)


补充:匿名函数

lambda函数的语法只包含一个语句,如下: lambda arg1,arg2,…argn:expression(主要是看下面的例子)


 
# 普通python函数
def func(a,b,c):
    return a+b+c
 
print (func(1,2,3))
# 返回值为6
 
# lambda匿名函数
f = lambda a,b,c:a+b+c
 
print f(1,2,3)
# 返回结果为6

大家注意观察上面的Python示例代码,f = lambda a,b,c:a+b+c 中的关键字lambda表示匿名函数,
冒号:之前的a,b,c表示它们是这个函数的参数。
匿名函数不需要return来返回值,表达式本身结果就是返回值。

用filter函数解决问题:

data=[3,9,-1,10,20,30,-4]
filter(labda x : x>=0,data)

用列表解析解决问题:

data=[3,9,-1,10,20,30,-4]
data=[ x for x in data if x>=0]

两种方法的时间比较:
在这里插入图片描述

- 筛出字典{‘zhangsan’:90,‘lisi’:60,‘wangwu’:88,‘zhaoyun’:96}中值高于90的项。

解决办法:字典解析

from random import randint
dict={x:randint(60,100) for x in range(1,21)}
dict={k,v for k,v in items() if v>90}

dict.items(): Return a copy of the dictionary’s list of (key, value) pairs.
dict.iteritems(): Return an iterator over the dictionary’s (key, value) pairs.
dict.items()返回的是一个完整的列表,而dict.iteritems()返回的是一个生成器(迭代器)。
dict.items()返回列表list的所有列表项,形如这样的二元组list:[(key,value),(key,value),…],dict.iteritems()是generator, yield 2-tuple。相对来说,前者需要花费更多内存空间和时间,但访问某一项的时间较快(KEY)。后者花费很少的空间,通过next()不断取下一个值,但是将花费稍微多的时间来生成下一item。
Python3.5中:iteritems变为items


- 筛出集合{10,20,40,……}中能被3整除的元素。

集合解析:

from random import randint
data=[randint(-10,10) for _ in range(10)]
s = set(data)
s={x for x in s if x%3==0}

在这里插入图片描述

  • 5
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值