学习python 第三十一天

最新推荐文章于 2019-07-22 20:16:52 发布

mr.杰瑞

最新推荐文章于 2019-07-22 20:16:52 发布

阅读量75

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/jerryvd/article/details/93514013

版权

python 专栏收录该内容

47 篇文章 0 订阅

订阅专栏

下载数据 - urllib / requests / aiohttp（aiohttp则是基于asyncio实现的HTTP框架）
urllib的request模块可以非常方便地抓取URL内容，也就是发送一个GET请求到指定的页面
get

from urllib import request
 request.urlopen('ur')

post
POST发送一个请求，只需要把参数data以bytes形式传入

login_data = parse.urlencode([
    ('param', 1),
    ('pagerefer', '看提交的地址')
])
req = request.Request('请求地址')
req.add_header('Origin', '原始地址')
req.add_header('设备')
req.add_header('Referer', '目标地址')
request.urlopen(req, data=login_data.encode('utf-8'))

解析数据 re正则 / lxml / beautifulsoup4（bs4）添加链接描述/ pyquery添加链接描述
lxml是python的一个解析库，支持HTML和XML的解析，支持XPath解析方式，而且解析效率非常高
from lxml import etree
etree.HTML()
etree.HTML()可以用来解析字符串格式的HTML文档对象，将传进去的字符串转变成对象
etree.tostring()
etree.tostring()方法用来将对象转换成字符串

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mr.杰瑞

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
学习python 第三十一天

下载数据 - urllib / requests / aiohttp（aiohttp则是基于asyncio实现的HTTP框架）urllib的request模块可以非常方便地抓取URL内容，也就是发送一个GET请求到指定的页面getfrom urllib import request request.urlopen('ur')postPOST发送一个请求，只需要把参数data以byte...
复制链接

扫一扫