爬虫
文章平均质量分 90
Yi_Kong
Sometimes,words don't work.
展开
-
超级鹰+selenium规避检测模拟登录12306
环境准备1.python3.6+2.超级鹰账号(超级鹰官网)3.selenium4.谷歌浏览器88版(涉及selenium规避检测)流程分析1.selenium打开浏览器,跳转账号密码登录页面2.获取验证码图面3.超级鹰处理验证码4.模拟输入账号密码并点击验证码5.解决登录滑块1.跳转账号密码页面现在大多数平台的初始登录页面都是二维码,这里通过selenium点击实现切换登录模式 # 打开页面,切换登录模式 bro.get('https://kyfw.12306.c原创 2021-02-06 08:58:04 · 1075 阅读 · 1 评论 -
爬取复仇者联盟4豆瓣短评生成词云
Python在众多编程语言中有着很多强大的依赖库支持,能用很简短的代码完成很复杂的事情。最近复仇者联盟4非常火爆,而且口碑炸裂。因此,作者运用Python对此电影做了一些简单的分析。分析的具体流程如下:1.数据获取:使用爬虫在豆瓣网上获取信息2.数据清洗:清洗html中的标签3.数据展示:把数据以图片的形式展现出来第一部分(数据获取)这是爬虫中要用到的依赖库,这里就不展开了(因为都是...原创 2019-04-26 00:08:05 · 947 阅读 · 0 评论 -
爬取公众号历史推文,PDF格式保存本地。
一、需求分析很多公众号上的原创类型推文都是作者呕心沥血创作出来的精华。例如推送的是一些生活tips、科技时讯、技术教程,又或者是推送上有你的美好回忆,每次去看的时候都要在众多公众号中寻找。然而,有时候可能因为该公众号的停止运营或是转让,你想要的那片篇推送会被删除或者找不到了。那么微信只支持收藏推送,怎么把它保存到本地呢?莫慌,万物皆可爬!二、环境准备1.python32.reque...原创 2019-07-19 22:20:34 · 1088 阅读 · 0 评论 -
Matplotlib可视化预测双色球
步骤1.获得数据2.清洗保存数据3.读取数据并可视化4.得出结论首先,简单说下国民彩票双色球的规则:选6位数字作为红球和1位数字作为篮球组成一注彩票,红球的区间是1~33,蓝球的区间是1 ~ 16。篮球+红球与开奖号码相同的个数决定中奖的金额。其中的单式,复式等玩法就不展开了,这里主要复习爬虫和可视化1.获取数据毋庸置疑,有数据才能分析。这里的数据来源有两个:一是自己写爬虫获取,...原创 2019-08-25 11:39:10 · 658 阅读 · 0 评论