自学爬虫——day2

自己动

我们导入了 web 驱动模块
from selenium import webdriver

无形的浏览器phantomJS

一些零散点

将 python 对象转化为 json是这样的
json.dumps()
将json数据转化为python对象是这样的
json.loads()

网页版微信可以查看memberlist

python从未缩进的非函数非类的代码开始执行

时间

print("%s"%(time.strftime("%Y-%m-%d %H:%M:%S",time.localtime())))
time.strftime() 接收电脑时间,以字符串形式返回电脑的当前时间,返回的格式由参数控制。

将程序短暂的停顿一下,这个时候就需要用到time包下面的sleep函数

class A(B):
pass 表示的是A继承B,如果A没有继承,就不需要写

.format方法的基本语法是通过 {} 和 : 来代替以前的 % 。
前面的{}叫做槽

初始界面有每一个对象的主图,进入组图的链接之后每一个对象的组图数目是不一样的,因此需要获取每一个进入的url的图片数量

find_all(‘a’)[-2]就是返回倒数第二个数

os.mkdir(title)创建目录
Referer,告诉服务器该网页是从哪个页面链接过来的

对象(meizi)图差一点点下载完,存在下载之后内容太小的问题,新的一个mmlei有待进一步尝试

在最后,分享小帅b的一句话:高效的自学=自学能力+源动力+耐心+总结

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值