技术撩妹 | 我是如何用Python搞定女神的联系方式的?

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1

访问flyai.club,一键创建你的人工智能项目

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1

 

作者 | IFTC

源自 | https://www.jianshu.com/p/bdcd11afcc2b

 

前言

 

这个没什么技术难度,懂爬虫的人和程序员都可以用学的语言写出来。

 

只是很多安全问题的存在,的确影响着我们的生活。

 

希望大家可以认识到一些网站的后台密码的规则与自己的安全性。

 

简单的说,就是是程序员的懒,让用户的信息暴露在互联网上。

 

还有一点:

 

就是希望正在接触python,和快要放弃学习的同学,可以试试换种思路,

 

来试试爬虫,这样有成就感的累积,可以慢慢提升你的自信。

 

爬虫开始前的准备:

 

  1. python2.7

  2. 库文件(xlwt,urllib2,BeautifulSoup4,xlrd)

 

安装库文件的方法:

 

最好在你的python2.7/script/下面打开power shell(可以shift+右击) 执行下面的:

 

安装库文件

 

pip install *** ***是指上面的库文件,下面不一定都用,只要上面的,以后出什么错,你就继续pip install

 

 

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1

 

观察网站结构(密码规则)

 

120853_17AY_3770883.gif

 

首先这个规则是针对大二和已经毕业了的

 

密码规则没有添加验证码(其实添加验证码也没什么用,只是添加了爬取门槛)

 

规则是 用户名==密码

 

符合条件

 

120853_aiuc_3770883.gif

 

这里的用户信息

 

不要在意这些细节(马赛克) 朦胧美一直是我的追求

 

具体思路:模拟登陆 ==》制作学号规则==》信息查询(爬取)==》存入xls模拟登陆:因为我们是用爬虫取信息,每次访问,肯定是登陆了以后才可以访问我们的信息 ==》模拟登陆

 

当我们用脚本访问下一个页面,需要一个cookie信息,就好比,当你打开qq空间,其实是想腾讯那里提交了自己的信息,而我们的信息就存在cookie中

 

python 中cookie维持会话访问:

 

120853_lmdc_3770883.gif

 

模拟登陆

 

具体网址不分享,避免带来不必要的麻烦

 

120853_kfvh_3770883.gif

 

学号的列表

 

用户信息的获取

 

120853_gYGz_3770883.gif

 

这里用的的是beautifulsoup库

 

120853_e4YA_3770883.gif

 

写入xls(这个是思路)测试用的函数

 

因为在写的时候因为编码问题,不能写入中文

 

 

120853_IBp9_3770883.gif

 

开始行动

 

添加上延迟访问: time.sleep(1)

 

因为爬虫访问的不和人一样,访问会很快,这样可以避免被封ip,还有避免给站点带来不好的影响。

 

 

程序执行结束:

 

部分截图:有图有真相,避免无知的喷子

 

学号规则很好找的,这样就获取半个学校的call和qq啦,至于能干嘛,自己脑补。。。

 

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1

 

—  End —

转载于:https://my.oschina.net/u/3770883/blog/1813444

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值