![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
enjoy_code_
这个作者很懒,什么都没留下…
展开
-
python 简单模拟网站访问及数据解析
解析网页技术模块名技术特点re模块正则表达式* 基于文本的特征来匹配或查找指定数据 *可以处理任何格式的字符串文档,类似于模糊匹配的效果lxml模块beautifulsoup4XPath和Beautiful Soup 基于HTML/XML文档的层次结构来确定达到指定节点的路径 更适合处理层级比较明显的数据json模块JSONPath用于JSON文档的数据解析解析工具的性能比较抓取工具速度使用难度安装难度re最快原创 2021-03-23 09:53:40 · 1086 阅读 · 2 评论 -
python简单模拟网页访问
浏览网页的过程可分为以下四个步骤:浏览器通过DNS服务器查找域名对应的IP地址;向IP地址对应的Web服务器发送请求;Web服务器响应请求,返回HTML页面;浏览器解析HTML文本,并显示页面实践内容:1.使用urllib模块import urllib.request as ururl="https://www.baidu.cn/" #访问目标网页info = ur.urlopen(url) #return 得到一个response的对象print(info原创 2021-03-23 09:22:47 · 2429 阅读 · 0 评论