模块
- 当__name__=__main__时,表示调用自身函数,被其他模块引入
- 匿名函数:lambda表达式
格式:lambda 参数1,参数2:结果表达式
list1=['orange','apple','zoo','inter','blue']
print(sorted(list1,key=lambda x:len(x)))
- 全局变量:global变量
字符串
- len函数计算字符串的长度
- find从字符串中查找字串所在位置
- index与find类似但找不到字串时会引发异常
- strip获得字符串修剪两边空格
常用数据结构
列表
1.定义:以"[]"包裹的内容,其中可存放多个元素,每个元素用逗号隔开,元素可以是不同类型
2.在列表中添加元素(增)
- 添加单个元素:
list1=[1,2,3]
list1.append(4)
print(list1)
- 添加多个元素
list1=[]
list2=[1,2,3]
list1.extend(list2)
print(list1)
-
插入一个元素:
语句:list.insert(参数1,参数2)
参数1:插入位置的下标
参数2:插入的值
3.删除列表中的元素(删):
-
删除一个元素:
list.pop(参数)
参数表示要删除的元素的位置,若不写默认删除最后一个元素
list.remove(参数)
参数表示元素的值, 根据元素的值来删除, 当有多个重复的元素的时候, 删除第一个匹配的元素 -
清除操作
list.clear() 清除了元素,而列表依然存在 -
删除操作
del list 将整个列表删除了
4.修改列表中的元素(改):
list[下标]=值
5.获取列表中的元素(查):
根据下标获取, 下标从0开始, 不能越界
字典
1.定义:以"{}"包裹元素,每个元素都是由一个键和一个值组成的“键值对”,键和值通过冒号分开
2.在字典中添加元素(增):
- 格式:字典名[key]=值元组中的元素不可以被增加,修改或删除
当key不存在的时候, 添加一个新元素
当key存在的时候, 则修改该key对应的值
3.在字典中删除元素(删): - 根据key来删除值:字典名.pop(key)
在字典中查找元素(查):
通过key值获取:字典名[key]与字典类似, 一组key的集合, 没有value
通过get的方式访问:字典名[get]无序无重复元素的集合
元组(tuple)
1.定义:一种有序的集合,元素不可以被增加,修改或删除
2. 在元组中查询元素
- 格式:元组名[下标]
集合(set)
- 定义:与字典类似, 一组key的集合, 没有value,无序无重复元素的集合
- 添加多个元素(update):
set1 = {1,2,3,4,5,6}
set1.update([11,12])
print(set1)
删除元素(删): .remove
set2 = set([12,23,45,89,66,66,23])
set2.remove(45)
print(set2)
爬取百度新闻<a>里的网址
import requests
response=requests.get('https://news.baidu.com/')
response.encoding='utf8'
HTML=response.text
for line in HTML.split('\n'):
if '<a' in line and 'http' in line:
spilt=line.split('"')
for s in split:
if 'http' in s and "background-image not in s":
print(s)