3.1.3引入模块
模块(module):用来从逻辑上组织Python代码(变量、函数、类)本质就是py文件,提高代码的可维护性。
用import来引入模块。
(1)引入系统模块: import 库名
(2)引入自定义模块
建立文件test1,建立t1.py,在其中定义一个函数
def add(a,b):
return a+b
建立文件test2,建立t2.py,引入t1.py中的函数
from test1 import t1 #引入自定义模块
print(t1.add(3,5))
结果:8
3.2获取数据
下载库的方法:pip install 库名
418:被发现是爬虫
404:找不到
Urllib:
#获取一个get请求
import urllib.request
#获取一个get请求
response=urllib.request.urlopen("http://www.baidu.com")
print(response.read().decode('utf-8')) #对获取到的网页源码进行utf-8的解码
#获取一个post请求
import urllib.request
import urllib.parse
data = bytes(urllib.parse.urlencode({"hello":"world"}),encoding="utf-8") #转化成二进制
response = urllib.request.urlopen("http://httpbin.org/post",data=data)
print(response.read().decode("utf-8"))
#超时处理
import urllib.request
try:
response = urllib.request.urlopen("http://httpbin.org/get",timeout=0.01)
print(response.read().decode("utf-8"))
except urllib.error.URLError as e:
print("time out!")