- 博客(6)
- 收藏
- 关注
原创 第一个爬虫(将图片保存到指定位置,改用beautiful soup,网页翻页 )
1.原始版本 不同的网页编码可能不同。 2.改成requests.get 据消息 urlopen已经过时,现在尝试改成request.get 3.指定一下下载的位置,比如下载到 4.再尝试试试beautiful soup 5.每个网页上只有一张图片,需要翻页才能看到下一张图 可以自动在写一个自动获取网页页数。 ...
2018-08-26 21:36:10 916
原创 常用内建模块(itertools、urllib)
1.itertools(提供了非常有用的用于操作迭代对象的函数) count()会创建一个无限的迭代器,所以上述代码会打印出自然数序列 cycle()会把传入的一个序列无限重复下去 repeat()负责把一个元素无限重复下去,不过如果提供第二个参数就可以限定重复次数 chain()可以把一组迭代对象串联起来,形成一个更大的迭代器 groupby()把迭代器中相邻的重复元素挑出来放在一起 ...
2018-08-22 00:39:44 156
原创 常用的内建模块(struct、hashlib、hmac)
1.struct(bytes和其他二进制数据类型的转换) pack函数可以把任意数据类型转换成bytes ( >表示字节顺序是big-endian,也就是网络序,I表示4字节无符号整数。 后面的参数个数要和处理指令一致。 ) unpack把bytes转换成相应的数据类型 根据>IH的说明,后面的bytes依次变为I:4字节无符号整数和H:2字节无符号整数下面是我把上边的...
2018-08-16 01:35:58 226
原创 常用的内建模块(datetime,collections)
1.datetime(python 处理日期和时间的标准库 获取当前日期(datetime模块内包含一个datetime类) 创建指定的时间 datetime转换为timestamp(timestamp = 0 = 1970-1-1 00:00:00 UTC+0:00)(timestamp是一个浮点数) timestamp转换为datetime str转换成datetime ...
2018-08-11 23:58:01 151
原创 正则表达式
1.匹配方式 \d 匹配一个数字。 \w 匹配一个字母或者一个数字。 \s 匹配一个空格。 * 表示任意个字符,包括 0 个。 + 表示至少有一个字符。 ? 表示0 或 1 个字符。 {n} 表示n 个字符。 {n,m} 表示 n - m 个字符。 [ ] 表示范围。[0-9a-zA-Z]可以匹配一个数字或字母。 特殊字符用 \ 转义。【强烈建议使用Python的r前缀,...
2018-08-07 00:39:38 124
原创 返回函数、匿名函数
1.返回函数 说白了就是不返回结果,为了方便后面继续用到,而返回一个函数。。。 f 调用函数lazy_sum 返回的是一个函数 再次调用f()时才会返回计算的值:a = 在函数lazy_sum中又定义了函数sum,并且,内部函数sum可以引用外部函数lazy_sum的参数和局部变量,当lazy_sum返回函数sum时,相关参数和变量都保存在返回的函数中,这种称为“闭包(Closure)”...
2018-08-01 14:35:00 1039 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人