3.22 爬虫小记

今天刷视频的时候发现有些语法细节忘记了,随手一记:

在文本编辑器中,需要设置把Tab自动转换为4个空格,确保不混用Tab和空格。

整数运算永远是精确的(除法难道也是精确的?是的!),而浮点数运算则可能会有四舍五入的误差。

如果字符串里面有很多字符都需要转义,就需要加很多\,为了简化,Python还允许用r''表示''内部的字符串默认不转义,

print('\\t\') \ \

print(r'\\t\') \\t\

上面是在交互式命令行内输入,注意在输入多行内容时,提示符由>>>变为...,提示你可以接着上一行输入,注意...是提示符,不是代码的一部分

│>>> print('''line1
... line2
... line3''')
line1
line2
line3

│>>> _

Python的整数没有大小限制,Python的浮点数也没有大小限制,但是超出一定范围就直接表示为inf(无限大)。

默认情况下,dict迭代的是key。如果要迭代value,可以用for value in d.values(),如果要同时迭代key和value,可以用for k, v in d.items()。

由于字符串也是可迭代对象,因此,也可以作用于for循环:

因为dict的存储不是按照list的方式顺序排列,所以,迭代出的结果顺序很可能不一样。

默认情况下,dict迭代的是key。如果要迭代value,可以用for value in d.values(),如果要同时迭代key和value,可以用for k, v in d.items()。

由于字符串也是可迭代对象,因此,也可以作用于for循环:

for ch in 'ABC': ... print(ch) ... A B C

所以,当我们使用for循环时,只要作用于一个可迭代对象,for循环就可以正常运行,而我们不太关心该对象究竟是list还是其他数据类型。

通过collections模块的Iterable类型判断一个对象是可迭代对象:

from collections import Iterable isinstance('abc', Iterable) # str是否可迭代 True

isinstance([1,2,3], Iterable) # list是否可迭代 True

isinstance(123, Iterable) # 整数是否可迭代 False

Python内置的enumerate函数可以把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引和元素本身:

for i, value in enumerate(['A', 'B', 'C']): ... print(i, value) ... 0 A 1 B 2 C 上面的for循环里,同时引用了两个变量,在Python里是很常见的:

for x, y in [(1, 1), (2, 4), (3, 9)]: ... print(x, y) ... 1 1 2 4 3 9

但如果要生成[1x1, 2x2, 3x3, ..., 10x10]怎么做?方法一是循环:

L = [] for x in range(1, 11): ... L.append(x * x) ...

L [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

但是循环太繁琐,而列表生成式则可以用一行语句代替循环生成上面的list:

[x * x for x in range(1, 11)] [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

写列表生成式时,把要生成的元素x * x放到前面,后面跟for循环,就可以把list创建出来 for循环后面还可以加上if判断,这样我们就可以筛选出仅偶数的平方:

[x * x for x in range(1, 11) if x % 2 == 0] [4, 16, 36, 64, 100] 还可以使用两层循环,可以生成全排列:

[m + n for m in 'ABC' for n in 'XYZ'] ['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ'] 三层和三层以上的循环就很少用到了。

for循环其实可以同时使用两个甚至多个变量,比如dict的items()可以同时迭代key和value:

d = {'x': 'A', 'y': 'B', 'z': 'C' } for k, v in d.items(): ... print(k, '=', v) ... y = B x = A z = C

format

print('{0},{1}'.format('zhangk', 32))

# print('{i}'.format(for i in range(6)))
print('{},{},{}'.format('zhangk', 'boy', 32))

print('{name},{sex},{age}'.format(age=32, sex='male', name='zhangk'))

# 格式限定符
# 它有着丰富的的“格式限定符”(语法是{}中带:号),比如:

# 填充与对齐
# 填充常跟对齐一起使用
# ^、<、>分别是居中、左对齐、右对齐,后面带宽度
# :号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充

print('{:>8}'.format('zhang'))
print('{:0>8}'.format('zhang'))
print('{:a<8}'.format('zhang'))
print('{:p^10}'.format('zhang'))

# 精度与类型f
# 精度常跟类型f一起使用
print('{:.2f}'.format(31.31412))

# 其他类型
# 主要就是进制了,b、d、o、x分别是二进制、十进制、八进制、十六进制
print('{:b}'.format(15))

print('{:d}'.format(15))

print('{:o}'.format(15))

print('{:x}'.format(15))

# 用逗号还能用来做金额的千位分隔符
print('{:,}'.format(123456789))
复制代码

字典

学习到的新用法
data = {
    'id': '20120001',
    'name': 'Bob',
    'age': 20
}

# print(data.clear())
print(data.items())
print(data.values())
print(tuple(data.values()))
复制代码

输出:

dict_items([('id', '20120001'), ('name', 'Bob'), ('age', 20)])

dict_values(['20120001', 'Bob', 20])

('20120001', 'Bob', 20)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值