【三十三】Python全栈之路--FTP项目

最新推荐文章于 2023-02-23 19:10:01 发布

熬夜泡枸杞

最新推荐文章于 2023-02-23 19:10:01 发布

阅读量442

点赞数

分类专栏： Python 文章标签：网络 python 开发语言

本文链接：https://blog.csdn.net/weixin_46818279/article/details/122032875

版权

Python 专栏收录该内容

58 篇文章 71 订阅

订阅专栏

文章目录

1. 爬虫案例

# ### 协程例子
"""
# (1) spawn(函数,参数1,参数2,参数 .... ) 启动协程
# (2) join 阻塞,直到某个协程在任务执行完毕之后在放行
# (3) joinall 等待所有协程任务执行完毕之后放行;
	  g1.join()  g2.join() <=> gevent.joinall( [g1,g2..] )
# (4) value 获取协程任务中的返回值 g1.value  g2.value
"""
from gevent import monkey ; monkey.patch_all()
import gevent
import time
import requests

"""
def eat():
	print("eat1 开始吃 ... ")
	time.sleep(1)
	print("eat2 继续吃 ... ")
	return "吃完了"	
	
def play():
	print("play1 开始玩 ... ")
	time.sleep(1)
	print("play2 继续玩 ... ")
	return "玩完了"

# 创建协程对象g1
g1 = gevent.spawn(eat)
# 创建协程对象g2
g2 = gevent.spawn(play)
# 等待所有协程任务执行完毕之后放行
gevent.joinall( [g1,g2] )
print("主线程执行结束 ... ")
# 获取协程任务中的返回值
print(g1.value)
print(g2.value)
"""

# (2) 利用协程爬取数据
"""
HTTP 状态码
	200 ok
	400 bad request
	404 not found
"""

"""
import requests
response = requests.get("http://www.baidu.com")
# print(response ,type(response) )

# 获取状态码
print(response.status_code)
# 获取网页中的字符编码
res = response.apparent_encoding
print(res) # utf-8
# 设置编码集,防止乱码
response.encoding = res
# 获取网页内容
res = response.text
print(res)
"""


url_lst = [
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/",
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/",
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/",
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/",
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/",
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/",
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/",
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/",
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/",
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/",
	"http://www.baidu.com",
	"http://www.jd.com/",
	"http://www.taobao.com/",
	"http://www.amazon.cn/",
	"http://www.pinduoduo.com/",
	"http://www.4399.com/"
]


def get_url(url):
	response = requests.get(url)
	if response.status_code == 200:
		# print(response.text)
		pass
		
# (1) 正常爬取
"""
startime = time.time()
for i in url_lst:
	get_url(i)
endtime = time.time()
print(endtime-startime) # 12.648817539215088
"""
# (2) 用协程的方法爬取数据
lst = []

startime = time.time()
for i in url_lst:
	g = gevent.spawn(get_url , i)
	lst.append(g)
	
gevent.joinall( lst )
endtime = time.time()
print("主线程执行结束 ... 时间{}".format(endtime-startime)) # 1秒

小总结：

协程是线程具体的一种实现，协程遇到堵塞要跳转，切到其他地方执行任务
g.join() 会变成同步，需要把每个对象存在列表中
p.result() 线程的返回值，也是变成同步的（不能放到循环下面），所以要存在一个列表中

2. FTP_登录_退出

3. FTP_下载

4. FTP_注册

熬夜泡枸杞

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【三十三】Python全栈之路--FTP项目

文章目录1. 爬虫案例2. FTP_登录_退出3. FTP_下载4. FTP_注册1. 爬虫案例2. FTP_登录_退出3. FTP_下载4. FTP_注册
复制链接

扫一扫

专栏目录