![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 92
mumusoo
这个作者很懒,什么都没留下…
展开
-
话本小说网-文章内容爬取
1、阅读限制 2、实际返回html页面中有内容。 3、代码如下:# coding: utf-8import urllib2from bs4 import BeautifulSoupimport sysreload(sys)sys.setdefaultencoding('utf-8')f = open("out.txt", "a+")header原创 2018-06-21 12:17:32 · 1357 阅读 · 1 评论 -
笔趣阁 单篇小说采集
# coding: utf-8# 笔趣阁 单篇小说采集 http://www.biquge.com.tw# 替换第一章地址,总章节数。# ip.txt 为代理池。import urllib2from bs4 import BeautifulSoupimport sysimport tracebackimport randomreload(sys)sys.setdefaulte...原创 2018-06-29 15:35:06 · 1934 阅读 · 0 评论 -
免费代理采集-多线程验证
1、采集地址:http://www.xicidaili.com/nn/ 2、根据实际需求修改验证地址 3、免费代理稳定性不可靠,在使用中可增加重试,切换代理# coding: utf-8import urllib2from bs4 import BeautifulSoupimport urllibimport socketimport threadingUser_Agent...原创 2018-06-29 15:51:44 · 785 阅读 · 0 评论 -
小说旗 单篇文章采集
1、代理文档格式:(代理采集地址 http://www.xicidaili.com) 2、免费代理稳定性不可靠,采用装饰器重连同时切换代理# coding: utf-8# pyhotn 2.7# 小说棋 单篇小说采集 http://www.xs7.la/# 替换第一章地址,总章节数。# ip.txt 为代理池。import urllib2from bs4 impo...原创 2018-07-11 11:56:48 · 1872 阅读 · 0 评论 -
使用urllib2访问https ——ssl.c:503 错误
环境:python2.7.5 描述:使用urllib2访问部分https网站时出现 ——ssl.c:503 错误。 解决方法:将python版本升级到2.7.11,错误解决。原创 2018-07-12 13:49:57 · 929 阅读 · 0 评论