自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 第一个爬虫(将图片保存到指定位置,改用beautiful soup,网页翻页 )

1.原始版本不同的网页编码可能不同。2.改成requests.get 据消息 urlopen已经过时,现在尝试改成request.get3.指定一下下载的位置,比如下载到4.再尝试试试beautiful soup5.每个网页上只有一张图片,需要翻页才能看到下一张图可以自动在写一个自动获取网页页数。  ...

2018-08-26 21:36:10 900

原创 常用内建模块(itertools、urllib)

1.itertools(提供了非常有用的用于操作迭代对象的函数)count()会创建一个无限的迭代器,所以上述代码会打印出自然数序列 cycle()会把传入的一个序列无限重复下去 repeat()负责把一个元素无限重复下去,不过如果提供第二个参数就可以限定重复次数 chain()可以把一组迭代对象串联起来,形成一个更大的迭代器 groupby()把迭代器中相邻的重复元素挑出来放在一起...

2018-08-22 00:39:44 144

原创 常用的内建模块(struct、hashlib、hmac)

1.struct(bytes和其他二进制数据类型的转换)pack函数可以把任意数据类型转换成bytes ( >表示字节顺序是big-endian,也就是网络序,I表示4字节无符号整数。 后面的参数个数要和处理指令一致。 ) unpack把bytes转换成相应的数据类型 根据>IH的说明,后面的bytes依次变为I:4字节无符号整数和H:2字节无符号整数下面是我把上边的...

2018-08-16 01:35:58 197

原创 常用的内建模块(datetime,collections)

1.datetime(python 处理日期和时间的标准库 获取当前日期(datetime模块内包含一个datetime类) 创建指定的时间 datetime转换为timestamp(timestamp = 0 = 1970-1-1 00:00:00  UTC+0:00)(timestamp是一个浮点数) timestamp转换为datetime str转换成datetime ...

2018-08-11 23:58:01 125

原创 正则表达式

1.匹配方式\d 匹配一个数字。 \w 匹配一个字母或者一个数字。 \s 匹配一个空格。 * 表示任意个字符,包括 0 个。 + 表示至少有一个字符。 ? 表示0 或 1 个字符。 {n} 表示n 个字符。 {n,m} 表示 n - m 个字符。 [ ]  表示范围。[0-9a-zA-Z]可以匹配一个数字或字母。 特殊字符用  \  转义。【强烈建议使用Python的r前缀,...

2018-08-07 00:39:38 90

原创 返回函数、匿名函数

1.返回函数说白了就是不返回结果,为了方便后面继续用到,而返回一个函数。。。f 调用函数lazy_sum 返回的是一个函数再次调用f()时才会返回计算的值:a = 在函数lazy_sum中又定义了函数sum,并且,内部函数sum可以引用外部函数lazy_sum的参数和局部变量,当lazy_sum返回函数sum时,相关参数和变量都保存在返回的函数中,这种称为“闭包(Closure)”...

2018-08-01 14:35:00 994 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除