爬虫
play_big_knife
这个作者很懒,什么都没留下…
展开
-
Python实战案例:金庸的功夫流派、人物关系的分析案例(上)
Python实战案例:金庸的功夫流派、人物关系的分析案例(上)一、项目说明在香港的探案剧中, 经常见到这样的场景,为了分析某一桩谋杀案或者是失踪案,会把案件的可疑人员和与被害者的关系人员全部找出来,构建一个关系网。对关系网中的每一个人分析其做案动机。如下图所示。类似上图这种网络关系的图表,可能使用python的networkx来进行网络关系图的绘制。不过,这里没有案件,这里没有被害人。我们以金庸的人物、武功及小说原文来说明networkx的使用,这也可以说是金庸的功夫流派、人物关系的分.原创 2020-11-23 21:23:27 · 1218 阅读 · 0 评论 -
Python实战案例:爬取中国执行信息公开网
从面试题谈起谈到这个项目的爬虫,就要从一道面试题谈起了。这道面试题是:请写一个爬虫从网址 http://zxgk.court.gov.cn/shixin/,检索被执行人姓名:"阿里",并填入验证码后查询,抓取结果列表,与对应的详情,并将内容导出为csv。根据这道面试题的情境,进入到地址http://zxgk.court.gov.cn/shixin/,在“被执行人姓名/名称”后面的输入框中输入“阿里”,再输入验证码,点击红色的“查询”按钮。如下图所示。现在需要抓取的是查询后的结果数据,原创 2020-11-13 22:00:34 · 5661 阅读 · 9 评论 -
Python实战项目:高血压项目详解(下)
四、爬虫数据来源 ⇒ 有关高血压文章、文献、论文——外国网站爬取翻译 ⇒ 爬取文章(高血压——Hypertension)+ 英文翻译成中文软件模块 ⇒ selenium(模拟自动化测试)+ lxml模块版本说明 ⇒ selenium == 3.141.0 + lxml == 4.5.0 translate == 3.5.0步骤(1)利用selenium中的webdrier(2)用get使浏览器进入到对应的网址(3)调用Web.原创 2020-09-21 15:28:07 · 1167 阅读 · 0 评论