Python Day 11

~模块:
一个py文件就是一个模块
包含内容:类,函数,变量和语句
好处:避免类,函数,变量的重名
提高代码的可维护性
提高代码的可重用性
模块分类:
1.系统内置模块
2.第三方模块
3.自定义模块
导入模块:
import 模块名 [as 别名]—模块名.类 模块名.函数 模块名.变量
from 模块 import 类,函数,变量—直接使用类,函数,变量
每个模块中有一个__name__变量,记录着运行时当前所在模块的名字
当一个模块被导入到其他模块使用时,输出的是自己模块的名字
如果在自己的模块中调用,输出的是__main__,顶级模块的名字

if __name__ == '__main__':# 加入此代码直接运行的当前模块,作为主程序运行
	print('hello world')

~包:类似于目录,管理一些功能相似的模块
避免模块的重名
包和目录的区别:包中包含__init__.py文件
导入别的包中的模块:import 包名.模块名
~内置常用模块:
random—产生随机数
uuid—产生一串不重复的随机数
help()可查看方法介绍
math—数学运算:
round()—全局函数,四舍五入运算
math.ceil()-向上取整
math.floor()-向下取整
math.sqrt()-求平方根
time—与时间有关的模块
time.time()-获取当前时间(单位是s)
time.localtime(seconds=None)-获取当前时间(年月日)
time.strptime()-字符串–》时间
time.sleep(second)-时间休眠
与目录有关的操作:
os与os.path
os模块:
os.getcwd()-获取当前工作路径
os.mkdir()-创建一级目录
os.makedirs()-创建多级目录
os.rmdir(‘文件名’)-删除一级目录,要求目录必须是空的
os.removedirs()-删除多级目录
os.remove(‘目录名/文件名’)-删除文件

python中默认编码是UTF-8,不同编码格式,所占内存空间不同
1.创建流对象
2.读,写
3.关闭流
with open (file,mode,encoding) as f:
pass
with语句块自动关闭流
对象的的序列化和反序列化:
序列化:对象–>字节序列
反序列化:字节序列–>对象
pickle模块:
pickle.dump–序列化
pickle.load–反序列化
~爬虫:
用程序模拟用户/浏览器,按照一定的规则,批量发送网络请求,批量获取数据
爬虫分类:
1.通用爬虫:搜索引擎
2.聚焦爬虫:代码实现–精准定位
python 爬虫:
Get:参数拼接在url后面,显示在地址栏,不太安全,速度快
Post:参数不显示在地址栏,相对安全,数据量没限制,速度稍慢
405错误码,请求方法不支持。状态码:200正常返回
User-Agent:客户端身份
Cookie:存储网站用户信息
Referer:从哪个页面跳转过来的
步骤:
1.确定url
2.request 头 + params
3.response 数据:1.html 2.json类型
4.数据解析:1.(beautifulSoup (选择器)2.(正则表达式
5.数据的持久化:文件,数据库
6.数据可视化

urllib.request模块:
urllib.request.urlopen(url)–获取网页

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值