Python爬虫
Cake_C
小呆子一枚,学吧学吧。 有什么疑问可能不及时看csdn,可以投送opelac@qq.com。有空就会回复!我自己不会的话也可以一起探讨~
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python爬虫工具(2)--Requests[socks] --走本地PAC代理的爬虫
项目中遇到这样一个问题:我要爬取一个国外网站,requests必须走全局代理,但是存的数据库在国内,不可以用全局代理(否则直接超时)所以本地代理必须开成PAC但是此时老版的request将无法走PAC加速,因为不支持socks所以将request更新为支持socks的版本:pip install -U requests[socks]proxies = { "http": "socks5://127.0.0.1:1086", 'https': 'socks5://127.0.0原创 2020-07-08 13:37:52 · 2007 阅读 · 0 评论 -
Python爬虫工具(1)--Beautiful Soup
原文指路:https://cuiqingcai.com/1319.html这里为自己记录一些常用方法:实例化对象:soup = BeautifulSoup(html)创建一个beautifulsoup对象从爬虫爬下来的response可以用soup = BeautifulSoup(res.text)获得标签:对这样的html文档<title>The Dormouse's story</title><a class="sister" href="http:/原创 2020-07-06 19:14:04 · 295 阅读 · 0 评论
分享