- 博客(4)
- 收藏
- 关注
原创 探索百度指数与股价的关系
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar
2021-06-27 11:40:28 720
原创 python爬虫—“爱彼迎”:ERR_HTTP2_COMPRESSION_ERROR/网页可能暂时无法连接,或者它已永久性地移动到了新网址。
爱彼迎被爱彼迎制裁的半死不活,用requests什么数据都返回不了,甚至自己用chrome浏览器打开爱彼迎搜索以后,也会一直报错找了半天原因,也按照很多教程做了尝试,都没办法解决。只要打开新页面,就会报错,刷新一下内容才能出来。换成Firefox后根本打不开看来也只能用selenium打开一次,刷新一次了既然使用了selenium,那就试试从主页进去搜索城市的功能吧。path = r'...
2020-03-03 19:16:01 3404
原创 python爬虫—房地产—“房天下”的乱码问题解决
“房天下”网站爬取整体难度较小,爬取信息时,尽量在其一级页面进行爬取,本人一开始采取从一级页面获取二级页面的链接,进入二级页面爬取楼盘信息,以为这样的方法可以获取更全面的信息。但是!!!房天下二级页面下,采用xpath时,由于每个楼盘的网页构造不尽相同,导致要写很多套xpath,实在是太痛苦了,所以建议大家直接从一级页面爬取吧…一级页面(其网址翻页主要靠/b9{}/,与后面的page没啥关...
2020-03-02 23:11:55 712
原创 python爬虫—房地产—“安居客”的几个问题解决
在爬取“安居客”网站时,本人主要遇到了2个问题:1.网页数字加密在浏览器里点击检查后,网页中显示数字的地方,在源代码中显示为加密后的乱码。2.爬取部分内容后,requests无法访问报错。这个报错,我在网上搜索了很多解决办法没有用(应该是访问过多,ip被封的原因)解决方法1.解密(1)安装并倒入这几个库from io import BytesIOfrom fontTools.t...
2020-03-02 10:39:45 3057
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人