![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫
Click-N
这个作者很懒,什么都没留下…
展开
-
python数据提取bs4
使用bs4提取本地的html文件时,发生编码错误。如下 #-*- coding = utf-8 -*- #@Time : 2022/2/20 17:46 #@File : bs4数据解析.py #@software : PyCharm #bs4数据解析 #数据解析原理 1.标签定位,2.提取标签,标签属性中存储的数据值 #bs4 1.标签定位 1.实例化一个BeautifulSoup对象,并将页面源码加载到该对象中 #2.通过调用BeautifulSoup对象中相关的属性或者原创 2022-02-20 18:32:10 · 378 阅读 · 0 评论 -
python中网络请求模块requests模块和urllib模块
requests模块作用:模拟浏览器发送请求。 使用:(requests模块的编码流程) -导包 import requests -指定url -发起请求(get,post) -获取响应的数据(页面) -持久化存储(存储响应数据) 案例:爬取搜狗首页的页面数据: #爬取搜狗首页 import requests url = "http://www.sogou.com" #step2:发起请求 response=requests.get(url=url) #step3:获取响应数据 .text原创 2022-02-19 15:23:44 · 729 阅读 · 0 评论