Python新手学习(十二)

050

模块就是程序
有三种导入方式
1.import 模块名
2.from 模块名 import 函数名
3.import 模块名 as 新名字

051

模块

052

python标准库
pip install
import timeit

053

url+lib=urllib
url一般格式为(带方括号[ ] 为可选项)
protocol: //hostname[:port] / path /[;parameters][?query]#fragment
url由三部分组成:
1.协议:http,https,ftp,file,ed2k
2.是存放资源的服务器的域名系统或IP地址(有时要包含端口号,各种传输协议都有默认的端口号,如http的默认端口为80)
3.资源的具体地址,如目录或文件名等。

import urllib.request
resoponse=urllib.request.urlopen('http://www.fish.com')
html=resoponse.read()
html=html.decode("utf-8")
print(html)

054

爬一个猫的网站,我发现用校园网爬会出现
TimeoutError: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败
这个错误,用手机热点爬就不会,可能是因为公用网络的防火墙问题

import urllib.request
response=urllib.request.urlopen('http://placekitten.com/g/500/600')
cat_img=response.read()
with open('cat.jpg','wb')as f:
    f.write(cat_img)

在这里插入图片描述自己打开网页试了一下

import urllib.request
response=urllib.request.urlopen('https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1578481982251&di=b76ba033b293ea71e427123576dae733&imgtype=0&src=http%3A%2F%2Fwww.pig66.com%2Fuploadfile%2F2017%2F1220%2F20171220121416520.png')#打开网页
cat_img=response.read()
with open('dog.jpeg','wb')as f:
    f.write(cat_img)

在百度上找到个图片然后爬了下来,网页上面的网址直接下载不太行,要把图片点开找位置
在这里插入图片描述这是完成下载下来后的图
在这里插入图片描述类似urlopen()相同的命令还有geturl(),和info()
info()得到的是http的信息
getcode(),得到200为正常响应

055

修改headerd
1.通过request的headers参数修改
2.通过request.add_header()方法修改
方法:
一。延迟提交时间:使用time模块
time.slepp(5),延迟5秒执行
二。使用代理
1.参数是一个字典{ }
2.定制创建一个opener
3.安装一个opener
4.调用opener

056

煎蛋网的JS加密可以使用selenium绕开
看不懂啊。。。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值