- 博客(3)
- 收藏
- 关注
原创 日常学习|从企查查获取企业工商信息
这里临时快速写出来的简陋代码,能实现简单的功能我找到了天眼查、企查查和国家企业信用信息公示系统这三个可以获取企业工商信息的网站一开始是想要从’国家企业信用信息公示系统’入手的,可惜我对js的代码不是能熟悉,花了大把时间在__jsl_clearance的获取和’点按后选字’验证码上面,最后还是没有成功然后转向了’企查查’我为了不被ip封禁而设置了time.sleep并且我没有太多的ip...
2019-06-14 16:24:26
2516
原创 python爬虫 | 鸿鹄论坛评论爬取
这次爬取的是鸿鹄论坛的某个帖的评论这次实例的网页信息十分好爬,因为该网页使用的是静态网页,所以我这次加多了多线程和导入数据库的功能。注释和代码都在下面了,在爬取的评论当中关于楼主的发表没有包含在内(毕竟不是评论 逃~~)save函数中爬取详细信息我只写了一部分,可自行补充import requestsfrom lxml import etreeimport reimport ti...
2019-06-02 22:42:59
475
原创 Python爬虫 | 对广州市政府数据统一开放平台数据的爬取
Python爬虫 | 对广州市政府数据统一开放平台数据的爬取简单爬虫网页分析爬虫代码简单爬虫本次爬虫演示的是对 广州市政府数据统一开放平台 数据的爬取网页分析我们先到url=’ http://data.gz.gov.cn/odweb/dev/developer/serviceList.htm’这里,从左边下载排行随便点击一个链接,我点击的是’广州市各区幼儿园一览表’url=’ http...
2019-05-25 14:29:52
5664
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人